CARLOS N, BOUZA HERRER 
| VIVIAN SISTACHS VEG 


' a / 


y - ¿ ? ¡ ¿ y 4: ñ 
- dei: y » A Í y 
> ; ' y h ! 
y: : 
z RA As 8 ) ' ; y : A 
' 1 "Y , pá di uz 
0d . Ñ »] 
. Y A hi 4 o . j brad . ía 
Y 


A 


ESTADÍSTICA 
TEORÍA BÁSICA Y EJERCICIOS 


CARLOS M. BOUZA HERRERA 
VIVIAN SISTACHS VEGA 


EDITORIAL 
FÉLIX VARELA 


La Habana, 2002 


Estadísticos e-Books € Papers 


Edición: Andrés Pi Andreu 

Diseño interior: Ramón Jiménez Sánchez 

Diseño de cubierta: Marcelino Fernández Acosta 

Diagramación y realización computarizada: Rafael Lago Sarichev 


O Carlos N. Bouza Herrera y Vivian Sistachs Vega, 2002 


O Sobre la presente edición: 
Editorial Félix Varela, 2002 


ISBN 959-258-373-0 


Editorial Félix Varela 

San Miguel No. 1111 

e/ Mazón y Basarrate, 

El Vedado, Ciudad de La Habana, Cuba 


Estadísticos e-Books € Papers 


Prólogo 


Valga señalar lo que todos los que acuden a este libro saben: la esta- 
dística es la ciencia del análisis de datos numéricos. Por ello es emi- 
nentemente práctica. Los modelos que sustentan sus métodos están 
avalados. por teorías de la matemática. Por ello se espera que los alum- 
nos universitarios tengan conocimientos elementales de Álgebra y 
Análisis Matemático cuando comienzan su estudio. La lógica de los 
métodos estadísticos y de las decisiones emanadas de sus procedi- 
mientos es sustentada matemáticamente. Esto eleva la intuición de 
que estos son correctos a una categoría de verdad matemática. La 
controversia de establecer si la Estadística es una rama de la Matemá- 
tica. o si no lo es, mantiene una discusión académica muy virulenta 
desde hace años. Lo cierto es que sólo unos pocos trabajan en 
problemas de la estadística teórica y aún estos tienen de vez en vez 
que trabajar con datos numéricos. Por otra parte, todo modelo esta- 
dístico pasa por una validación de su justeza, por razonamientos 
probabilísticos o geométricos. 


La popularidad de la estadística está dada por sus aplicaciones 
-exitosas. De ahí que su estudio esté incluido en los curriculum de 
economistas, ingenieros, médicos, biólogos, psicólogos, sociólogos, 
etc. desde hace décadas. En la deducción de los modelos y procedi- 
- mientos empleamos un tiempo considerable en los cursos de estadís- 
tica que les brindamos. Pero siempre enfrentamos en nuestras clases 
la necesidad de desarrollar y proponer ejercicios prácticos en clases, 

trabajos de curso y tareas. Esto ha dado lugar a que haya una pléya- 
de de libros que tratan este problema. Este libro se incorpora modes- 
tamente a la serie de libros dedicados a presentar un conjunto de 
ejercicios, incluyendo la discusión de algunos resultados, y a propo- 
ner otros que permiten el entrenamiento de los alumnos. Los temas 
“cubiertos son los que más popularidad tienen en los cursos de esta- 
dística del nivel de pregrado. 
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Este libro ha tenido como antecedente el trabajo desarrollado hace 
años para elaborar un libro titulado Ejercicios de Estadística. En él par- 
ticipó un colectivo de autores del Departamento de Matemática Aplica- 
da de la Facultad de Matemática y Computación de la Universidad de 
La Habana. Este se elaboró como material auxiliar para las clases de 
las asignaturas de Estadística que se brindaban a los no matemáticos. 
La difusión del mismo creó nuevas expectativas en círculos más am- 
plios, lo cual motivó el que se nos propusiera elaborar un libro con una 
- mayor cobertura y objetivos más amplios que el servir cómo base para 
las clases prácticas. Después de desarrollar la tarea editorial de aquel 
libro quedaron sin ánimos para acometer la tarea de hacer este nuevo, 
casi todos los colegas. El objetivo del mismo era mucho más ambicio- 
so, pues nos propusieron desarrollar un nuevo conjunto de ejercicios 
que transcendiera la de sólo recopilar experiencias docentes. 


Esperamos este cubra las expectativas planteadas: ser un manual de 
ejercicios prácticos, utilizable en cursos de Estadística Descriptiva e 
Inferencial. 


Canos N. Bouza HERRERA 


VivIAN SisTaCcHS VEGA 


: Iv 
Estadísticos e-Books € Papers 


- Capítulo 1 
Estadística Descriptiva / 1 
1.1. Introducción / 1 
1.2. Distribución de frecuencias / 2 
1.3. Medidas de posición / 7 
"1.4. Medidas de dispersión / 12 
Ejercicios / 15 
Respuestas / 29 


Capítulo 2 

Teoría de Probabilidades / 33 

2.1. Definiciones de probabilidad / 33 

2.2, Variables aleatorias / 39 

2.2.1 Generalidades / 39 

2.2.2. Distribuciones de variables aleatorias discretas / 43 
2.2.3. Algunas distribuciones de variables aleatorias continuas / 47 
2.2.4. La Distribución Normal y Distribuciones asociadas / 51 
2.2.5. Distribuciones en el muestreo / 55 

2.2.6. El Teorema de Bayes / 60 

Ejercicios / 61 

Respuestas / 80 


Capítulo 3 
Estimación / 85 
3.1. Generalidades / 85 


V 
Estadísticos e-Books € Papers 


3.2. Estimación Puntual / 86 
3.3. Estimación por intervalos / 91 


3.3.1. Intervalos de Confianza para la media de una variable normal con varianza 
conocida / 91 : 


3.3.2. Intervalos de Confianza para la media de una variable normal con varianza 
desconocida / 92 


3.3.3. Intervalos de Confianza para la media de una variable no normal / 93 
3.3.4. Intervalos de Confianza para la proporción / 94 
3.3.5. Intervalos de Confianza para la varianza y la desviación típica 
de una variable normal / 95 
3.4. Tamaño de la muestra / 97 
3.5. Tabla resumen de los intervalos confidenciales / 98 
Ejercicios / 99 
Respuestas / 121 


Capítulo 4 

Pruebas de Hipótesis / 125 

4.1. Introducción / 125 

4.2. Pruebas para la media / 127 

4.2.1. Pruebas para la media con varianza conocida / 127 
4.2.2. Pruebas para la media con varianza desconocida / 131 
4.2.3. Pruebas para medias de poblaciones no normales / 133 
4.2.4. Pruebas para Proporciones / 134 

4.2.5. El uso de paquetes estadísticos / 135 

4.3. Pruebas sobre varianzas / 136 

4.3.1, Pruebas para o? / 133 

4.3.2. Comparación de dos varianzas / 137 

4.4. Pruebas para la diferencia de medias / 139 

4.4.1. El problema general / 139 

4.4.2. Muestras pareadas / 139 

4.4.3. Muestras independientes / 142 

4.4.3.1. Variables normales y varianzas conocidas / 142 
4.4.3.2. Variables normales y Varianzas desconocidas / 144 
4.4.4. Otros casos / 151 

4.4.4.1. Comparación de dos proporciones / 151 

4.4.4.2. Comparación de y, — , con un valor A distinto de cero / 151 


i vi 
Estadísticos e-Books é. Papers 


4.4.5. Uso de paquetes estadísticos / 152 
Ejercicios / 153 
Respuestas / 178 


Capítulo 5 


Análisis de la Varianza / 183 

5.1. Introducción / 183 

5.2. La clasificación simple y el diseño completamente aleatorizado / 184 
5.3. La clasificación Doble y el Diseño de Bloques Aleatorizados / 189 
Ejercicios / 195 

Respuestas / 211 


Capítulo 6 

Correlación y Regresión / 213 
6.1. Introducción / 213 

6.2. El coeficiente de correlación / 214 
6.3. La Regresión Lineal Simple / 219 
6.4. Regresión múltiple / 227 

6.5. Análisis de residuos / 230 

“ Ejercicios / 233 

Respuestas / 249 


Capítulo 7 

Métodos no paramétricos / 251 

7.1. Introducción / 251 

7.2. Tablas de contingencia / 252 

7.3. Problemas de una muestra / 257 

7.3.1. Las pruebas sobre la posición / 257 

7.3.2. La prueba ordinaria de los signos o binomial / 258 

7.3.3. La prueba de los signos rankeados o de Wilcoxon / 261 
7.4. Pruebas para la bondad del ajuste / 264 

7.4.1. Generalidades / 264 

7.4.2, Prueba Chi-cuadrado para la bondad del ajuste / 265 

7.4.3. Prueba de Kolmogorov-Smirnov para la bondad del ajuste / 267 
7.4.4. Las pruebas de aleatoriedad / 269 

7.4.4.1. El problema general / 269 

7.4.4.2. La prueba Chi-cuadrado / 269 

7.4.4.3. Las pruebas basadas en Rachas, Runflas o Corridas / 270 


Estadísticos e-Books € Papers 


7.4.4.3.1. La relación entre Rachas y Aleatoriedad / 270 

7.4.4.3.2. La prueba basada en el total de las Rachas / 270 
7,4.4.3.3. Prueba basada en las rachas, ascendentes y descendentes /273 
7.5. Las pruebas para dos muestras / 275 

7.5.1. Introducción / 275 

7.5.2. Las pruebas para la posición en dos muestras independientes / 276 
7.5.2.1. La prueba de la mediana / 276 

7.5.2.2. Prueba de Mann-Whitney / 278 

7.5.3. La prueba para la posición en dos muestras pareadas / 282 
7.5.3.1. Introducción / 282 

7.5.3.2. La prueba de los Signos / 282 

7.5.3.3. Prueba de los rangos signados de Wilcoxon / 285 

7.5.4. La prueba de Kolomogorov-Smirnov / 287 

7.6. Las pruebas para K > 2 muestras independientes / 290 

7.6.1. Introducción / 290 

7.6.2. La prueba de Kruskal-Wallis / 291 

“7.6.3. Extensión de la prueba de la mediana / 292 

7.7. Las pruebas para K > 2 muestras pareadas / 293 

7.7.1. Introducción / 293 

7.7.2. La prueba de Cochran / 293 

7.7.3. La prueba de Friedman / 295 

7.8. Medidas de asociación / 297 

7.9. Tratamiento de los empates / 299 

Ejercicios / 300. 

Respuestas / 318 


Capítulo 8 

Análisis Multivariado / 321 

8.1. Introducción / 321 

8.2. Análisis de Componentes Principales / 322 

8.3. Análisis Factorial Clásico / 330 

8.4. Análisis discriminante / 335 

8.5. Taxonomía numérica (Cluster Análisis) / 338 á 
8.6. La prueba de hipótesis de medias / 341 

8.7. Métodos gráficos multivariados / 344 

Ejercicios / 348 


el Vin 
-Estadísticos e-Books € Papers 


Tablas / 363. 
Bibliografía / 405 


EstadísticBs e-Books € Papers 


Capítulo 1 
Estadística Descriptiva 


1.1. Introducción 


En la vida nos enfrentamos con la necesidad frecuente de analizar ma- : 
sas de datos. Uno de los roles más importantes de la estadística es el 
de condensar estos datos en forma tal, que las regularidades presen- 
tes se hagan evidentes a los analistas. En ocasiones los datos son 
tomados de toda una población, se hace un censo, o de una parte de 
la población (muestra). Estos datos deben ser cuantificables para que 
el tratamiento estadístico tenga sentido. Por ello se considera que el 
fenómeno estudiado permite evaluar en cada caso observado una ca- 
racterística que le identifica. Esta característica puede ser cualitativa 
(como el sexo) o cuantitativa (como la edad). Dado que la característi- 
ca varía de observación en observación le llamaremos variable, cuya . 
definición formal es la siguiente: 


Definición 1.1. Al observar n casos (1,2,..., n) y evaluar en ellos una 
característica, una variable es una función X que le asigna a cada caso 
í un valor X.. 


Si la variable puede tomar valores de un conjunto finito, o la más nu- 
merable, esta es denominada “variable discreta” y si toma valores en 
un intervalo “variable continua”, es un variable real. 


Podemos ejemplificar cómo estos conceptos se utilizan en la práctica. 
Ejemplo 1.1. Se estudia un grupo de estudiantes y se les pregunta: 


1. ¿Qué color prefieren entre el rojo, el púrpura, el marrón, el azul, el. 
verde y el amarillo para su nuevo gallardete unicolor? 


2. ¿Cuál es su peso en kilogramos? 
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3. ¿Cuántos días a la semana estudian Historia? 

4. ¿Qué tiempo usan en estudiar Matemática? 

Diga qué variables se definen y cuáles son discretas y continuas. 
Solución 


1. El color es una característica cualitativa. Se puede asignar valores 
entre el 1 y el 6 alos colores y tendremos una variable discreta. 


2. Esta es continua, pues puede tomar infinitos valores. 


3. Esta es discreta, pues puede tomar valores en el conjunto 
(0,1,2,3,4,5,6,7). 


4, Esta es continua, dado que se mueve en un intervalo. 


1.2. Distribución de frecuencias 


Como hemos introducido, el objetivo de la estadística es analizar una can- 
tidad de datos representados por el conjunto de medidas.obtenidas. 


Los métodos usados para describir un conjunto de datos cualitativos o 
cuantitativos son agrupados o catalogados como “procedimientos de 
la Estadística Descriptiva”. Estos pueden clasificarse en métodos grá- 
ficos y numéricos. Los primeros pueden dar origen a multitud de pro- 
cedimientos, pues hay una gran variopinta de figuras utilizables para 
describir los datos en forma gráfica. Aquí nosotros nos enfrentare- 
mos solo a unos cuantos que tienen importancia en el resto de la 
estadística convencional. 


Cuando analizamos un conjunto de datos es natural que surja la nece- 
sidad de establecer qué sentido tienen. Una solución es buscar unas 
figuras adecuadas que representen sus propiedades. 


Consideraremos que los datos pueden ser clasificados en una de las k 
clases C.,...,C, tales que C¡ N C; =4, para todo ¡ + j. Estas pueden 
tener un sentido cualitativo como Sexo o cuantitativo como número de 
hijos. Cada observación puede ser clasificada en una clase y sólo en 
una de ellas. Entonces podemos usar la definición siguiente: 


Definición 1.2. Sea X,,... ,X, un conjunto de observaciones y n, el nú- 
mero de ellas que se clasifican en la clase C.. 


1. n es llamada frecuencia absoluta de la clase ¡i-ésima. 
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2. f, =n,/n es llamada frecuencia relativa 
donde: 

n=X3,n 
por lo que: 

yl 
3. N, =2,_n,es llamada frecuencia absoluta acumulada. 
y 
4. F, =2,../n, es llamada frecuencia relativa acumulada, 


El gráfico de estas frecuencias, absolutas o relativas, en el que se utili- 

'zan rectángulos para representarles, es llamado Gráfico de Barras, y la 
tabla correspondiente, Tabla de Frecuencias. En el caso discreto se 
dibuja una barra que tiene en el eje de X. Estos rectángulos tienen 
como base la amplitud de la clase, y como altura, la frecuencia. Note 
que si la trabajamos con variables cualitativas o discretas no agrupa- 
das, la clase es representada por un punto y sustituimos el rectángulo 
por un segmento de recta. Este es un problema tan común que hojas 
de cálculo como el Excel le brindan entre sus módulos. 


Ejemplo 1.2. En el ejemplo anterior se observan 10 niños y se obtuvieron 
como respuestas a la primera pregunta sobre el color de preferencia: 


1123145626. Construya la Tabla de Frecuencias y el Gráfico de Barras. 
Solución 


TABLA 1.1. 
Preferencia por los colores 


Frecuencia Precuenciía Frecuencia 


Fre cuencia absoluta relativa 


color absolu ; 
colar absoluta relativa (f) acumulada acumulada 
(N ) ' 


(1) 


MER NETAS ES ER RA 
2 pp 2 | 0 ||5 [| 05 |] 
Ea po ps [os | 
AE ANI IEC FEA AC 
ES, OLA, [E] 
— 21 


(59) 


pr. 


o | en 


(59) 


- Estadísticds e-Books €. Papers 


El gráfico correspondiente es dado en la Figura 1.1. 


0,4 
as] 
E 
3 0,3 
Ed 
>] 
5 0,2 . 
S M Serie 1 
= 
2 0,1 
aa 

0 
1 Z 3 4 5 6 
Colores 


FIGURA 1.1. Gráfico de Barras del ejemplo 1.2. 
Otro gráfico de común uso es el llamado “polígono de frecuencias”. En 
él se unen los puntos (x, frecuencia) mediante un segmento de recta. 


Ejemplo 1.3. Utilizando los datos del ejemplo 1.2 determine el polígono 
de frecuencias. 


Solución 
El gráfico obtenido al usar Excel es: 


4 


1 pi 3 4 3. 6 
FIGURA 1.2. Polígono de frecuencias del ejemplo 1.2. 


El algoritmo básico para construir una distribución de frecuencias cuan- 
do la variable es continua o aunque discreta se definen clases es el 
siguiente: 
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Algoritmo 1d 


1. Determinar el número de clases. 
Esto es fijado por el investigador. Idealmente debe estar entre 5 y 
20. En general, para muestras pequeñas usamos pocas clases. 


2. Determinar las clases. 
Si tenemos una variable cualitativa, cada cualidad puede constituir 
una clase. Si fuera cuantitativa, debemos fijar un intervalo para cada 
clase. Es recomendable que todas las clases e intervalos, tengan el 
mismo ancho. 


Un procedimiento recomendable es el siguiente: 
P1. Determinar x, < Mínimo de las variables y x, > Máximo de las variables. 


P2. Determinar k = número de clases o a = amplitud común de todas 
las clases. 


P3. Los intervalos (clases) son: 
C, =Lxy, Xx, + al=Lx, , x, [ 


C, =Lx, + a, x, + 2a[=[x,, x, + a [=Lx,, x, [: 


-C, =lx 


lo a É al=lx,,> x,] 


Ejemplo 1.4. Se toma una muestra entre los empleados de un hotel y 
se indaga sobre las propinas obtenidas en un día. Los ingresos obteni- 
dos por este concepto reportados son los dados en la Tabla 1.2. 


TABLA 1.2. 
Propinas declaradas por los empleados del hotel 
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Solución 
Entonces si fijamos k = 6 podemos usar: 


Xx, = 5, a = 4 por lo que C, =[5, 9[, C, =[9, 13[, C, =[13, 17[, C, = [17, 
21[, C, =[21, 25 [ y C, =[25, 29]. La Tabla 1.3 brinda los resultados en 
una tabla de frecuencias. 


TABLA 1.3. 
Distribución de frecuencias de las propinas declaradas 
por los empleados del hotel 


Frecuencias Frecuencia 
Intervalos absolutas relativas 


39 3 13 17 .21 25 29 


FIGURA 1.3. Distribución de frecuencias de las propinas declaradas por 
_ los empleados del hotel. 
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1.3. Medidas de posición 


Al tener un conjunto de datos es necesario caracterizarles usando una o 
varias funciones de ellos. Estas son llamadas estadígrafos o estadísticos. 


Definición 1.3. Un estadígrafo o estadístico es una función de los datos 
que no depende de valores desconocidos. 


Ante el interés del analista de establecer ciertas regularidades refleja- 
das por los datos, este utiliza estadígrafos que caracterizan la posición 
de ciertos puntos notables. Si tenemos los datos X,,..., X, y considere- 
mos la necesidad de estudiar algunas medidas que fijen su posición, 
estas son definidas como: 


Definición 1.4. Una medida de posición es un valor que permite esta- 
blecer la ubicación de los datos a partir de su distribución de frecuen- 
cias. Se dice que esta es de tendencia central, si permite establecer un 
cierto punto de equilibrio para la distribución de frecuencias. 


- En particular, trabajaremos con la noción de punto de equilibrio físico 
- dada por el baricentro: 


Definición 1.5. La media aritmética de los datos sin agrupar es: 


si estos están agrupados esta es calculable mediante: 


Enx, 


X,= -Y fX,= 
donde X”, marca de la clase, es: 
xo XX, 
z 


La media es el baricentro de la distribución. 

Otra importante medida de posición es la mediana: 

Definición 1.6. La mediana M es una medida que no supera ni es supe- 
rada por más de la mitad de los datos. Es decir, que si ordenamos 
ascendente o descendentemente los datos M es el valor central de la 
serie (si n es impar) o cualquier valor que esté entre los dos valores 
centrales de esta (si es par). 


Estadísticos '2-Books €. Papers 


Si los datos están agrupados, se determina la clase que contiene la 
mediana (C,,) y; 


donde: 
a, : es la amplitud de la clase que contiene la mediana. 


Ejemplo 1.5. Se hace un análisis de 50 mejores artículos publicados 
por una revista, 


a) Los resultados del número de citaciones fueron (ver Tabla 1.4): 


TABLA 1.4. 
Citación de artículos de una revista 


Número 
de citaciones [10 20[ | (20 30[ | [30 401 [40 SO[ | [50 60[ | 
Número 
de veces 2] 10 5 >) 
que fue citado 


b) La cantidad de páginas de los artículos citados entre 30 y 40 veces . 
fueron: 18 34 10 21 11 28. 


c) La cantidad de referencias que tenían los trabajos citados entre 40 y | 
50 veces fueron: 12 9 18 15. 


d) El número de autores de los trabajos analizados fue: 1232145352. 
¿Cuáles son las medianas? 


Solución 
a) El intervalo que contiene la mediana es [10 20[ pues n/2 = 25. 


Entonces, 
m=1 
Xm_- =10 
Mm =0 
UA = 10 
a, =10 
por lo que: 


M,=10+210=19,25 
27 i 
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b) Al ordenar tenemos: 10 11 18 21 28 34. La mitad de los datos es 3, 
por lo que: 


M= o =19,5 páginas 
c) La ordenación nos lleva a la serie 5 9 12 15 18, por lo que M = 12. 


d) La serie ordenada es 1 122233455. Como la mitad de los datos 
es 5, no supera más de 5-datos, ni es superado por más de 5 el 2. 
Por tanto, la mediana del número de autores es 2. 


Otra medida importante, aunque de menor uso, es la moda. 


Definición 1.7. La moda M* es el valor o valores con mayor frecuencia 
en los datos. Si estos están agrupados se calcula usando la fórmula: 


cuando C,, es la clase con mayor densidad. Esta es la que contiene la 
moda. ' 


Note que si todas las clases tienen la misma amplitud, la frecuencia de 
la clase, determina la moda. 


Ejemplo 1.6. En el ejemplo anterior calcule las modas. 
Solución 


a) Como las amplitudes son iguales, la clase modal es la de mayor 
frecuencia, por lo que: m = 1 y: 


Xp_1 =10 
Ay 1 =0 
Ms =10 
A, =10 
por lo que: 
10 


M*=10+-—-10 =11,0 
10 


Para b) 34, 10, 21, 11 y 28 son modas, para c) lo son 5 9 12 15 18y 
para d) es 2. 
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Otras medidas de importancia son: 

1. Máximo de los datos: Máx. (X,,....X_) =X.. 
2. Mínimo de los datos: Mín. (X.,....X_) =X,,.. 
También son importantes los cuantiles. 


Definición 1.8. El cuantil de orden p definido como x, es el valor máximo 
para el cual (Frecuencia relativa acumulada hasta x, = =p,0<p<1). 


En particular son muy utilizados en economía, medicina y biología los 
cuartiles en los que p = 0,25; 0,50 y 0,75. A estos los denotaremos 
mediante: Q,. Si p toma el valor 0,25 decimos que x,, y este es el 
cuartil de primer orden Q,, X, ¿y €s el cuartil de segundo orden Q, y X, 7% 
= Q,, el cuartil de tercer orden. Note que Q, es la.mediana. Son tam- 
bién de mucha importancia los percentiles de que son aquellos en los 
que p se expresa en términos porcentuales. Similarmente al tomar: 
p=0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 

se definen los deciles de primer orden, de segundo orden, etc.: D,. 


Ejemplo 1.7. Al llevar a cabo una investigación sobre las veces que los 
20 jugadores regulares de un equipo de pelota han sido amonestados 
en juegos se obtuvo: 


30231 1156003012310000 
a) Determine los cuartiles. 
_b) Determine el percentil del 90 %. 
Solución 


Al ordenar los datos tenemos: 0000000 1111122333356, 
siendo n = 20. Entonces: 


a) El 25 % de 20 es 5, e e Por lo tanto, Q, = 
0,Q,=1y0Q,=3 


b) El 90 % de 20es18y2,, =3 


En general, podemos dar una fórmula para calcular los percentiles cuan- 
do los datos están agrupados. 


Definición 1.9. Sea p = r/m el orden del percentil A, , calculado con los 
datos agrupados está dado por: 
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donde: 


C;: es la clase conN, > n <= Dios 


Ejemplo 1.8. Se evalúa él gasto de 173 clientes que visitaron un sitio de 
ventas por Internet. Al agrupar los datos (ver Tabla 1.5) se obtuvo: 


TABLA 1.5. 
Compras por Internet en el sitio de ventas 1 


Gasto en $ MIO SO[ [50, 100[ | [100, 1501 ¡ [150, 200[ | [200, 250[ 
clientes . 


Halle el percentil de orden 0,7. 


Solución 
Obtenemos la Tabla 1.6 de frecuencias dada por 1. 


TABLA 1.6. 
Distribución de frecuencias de las compras por Internet 
en el sitio de ventas 1 


RECORTES [0, SO[ LS 100[ | [100, 150[ | [150, 200[ | (200, 250[ | 


Se tiene que nr/m=173 -0,7=121,1, por lo que el percentil de or- 
den p = 0,7 pertenece a la clase C, 


Entonces: 


%,, = 100 + A 50 = 133,75 


En ocasiones, se trabaja con los deciles que sólo son los percentiles 
de orden 0,1; 02, etcétera. Note que 2, , = D 
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1.4. Medidas de dispersión 


Las medidas de dispersión nos permiten valorar cuan representativa 
puede ser una medida de posición 0 de los datos observados. Hay dos 
funciones muy populares: 


Desviación cuadrática media: 


n 2 
Y (Xx, -6) 
O, —= El 2 


Desviación absoluta media: 
»|x i -0l 
V, a t=l 
n 


Las medidas de dispersión más usadas son: 


Definición 1.10. La varianza de los datos está dada por 


Es la desviación absoluta media. 


Una medida relativa del error asociado a la media es: 


Definición 1.11. El coeficiente de variación es: 


Esta es una medida positiva. 
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Ejemplo 1.9. Se analizan las calificaciones de una prueba de velocidad 
en 400 metros y se obtienen los tiempos siguientes en minutos: 65, 60, 
63, 68, 65, 68. Halle la media, la varianza, la desviación típica y el 
coeficiente de variación. 


Solución 
y 
X, 

x.1--2 648 

6 

y (x,-X) 1(2 E 65 +...+68 
$ A - Ex nx? ¡Ea =7,79 

A UA WE 6 


La desviación típica es: 


y: 
2, |X, -X| 0,2+4,8+18+3,2+0,2+3,2 
A A A 
n 6 
siendo: 
cuz 00 
64,8 


Ejemplo 1.10. En 50 juegos de pelota se evalúa el número de batazos 
que pasan alos jardines. En ese análisis se obtuvieron los resultados 
de la Tabla 1.7. 
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TABLA 1.7. 
Evaluación de los batazos conectados que llegaron a los jardines 


DON (0.5 3,51 | 13,5 6,51 | 16,5 9.51 | 19,5 12,51 | [12.5 15.5 
de veces 

za poo pop po 
de juegos 


Halle la varianza, la desviación media y el coeficiente de variación. 
- Solución 


Al hacer la tabla de frecuencias (ver Tabla 1.8) y el cálculo en ella 
tenemos: 


[15,5 18,51 


TABLA 1.8. 
Datos y cálculo de los estadígratos para el ejemplo 1.10 


Número 
bces [0,5 3,5[4 [3,5 6,5[ | [6,5 9,5[ [| [9,5 12,5[ 4 [12,5 15,5[| [15,5 18,5[ 


Número 
de juegos 
(n,) 
Punto 


medio de 
la clase 


- OOO 
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Por tanto: 


01=2 a ES 
á n 50 ? 
k 
A, 160,4 
y =E AR E 
] n 50 
y 
17,29 
mm. LA 00 
X 884 


Otras medidas muy utilizadas son los-recorridos. Estos establecen la 
diferencia entre un par de cuártiles, deciles o percentiles. 


Definición 1.12. El recorrido es la diferencia entre Máximo (X.,..., Xx) y 
Mínimo (X,,..., X,). 


R= Máximo (X ,..., X,J - Mínimo (X,...., XJ. 
El recorrido intercuartílico es: 

Ku =0,0, 
El recorrido semicuartílico es igual a: 
Ro 75 


2 


Rors = 
Los recorridos entre los percentiles de orden b > a, están dados por: 


Au, =2,-A, 


Ejemplo 1.17. Calcule el recorrido intercuartilico usando los datos en el 
ejemplo 1.7. 


Solución 
Como Q, = 1 y Q, = 3, tenemos que A, ,, = Q,- Q, = 2. 
Ejercicios 


1. Se analiza el uso, por parte de los profesores de una facultad de Letras, 
de la tecnología digital, para obtener bibliografía. Se sabe que no más 
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del 50 % del tiempo es usado en esos menesteres. El especialista ana- 
liza utilizar uno de los cuatro grupos de clases dados a continuación: 


Gt: [O, 10[ [10,25[ [25, 35[ [27,45[ [45, 501 
G2: [0,20] [21, 30] [31,40] [41, 50] 

G3: [0,30[ [30,35[ [35, 50] 

G4: [0,10[ [10,201 [20, 30[ [30,40[ [40,50] 
Diga si son adecuados. Justifique su respuesta. 


2. Un psicólogo estudia cómo se adaptan a su nueva situación los 
alumnos extranjeros que se incorporan a estudios de doctorado en 
una universidad. Dan una calificación entre 1 y 100 al impacto de 

las dificultades en el rendimiento de ellos. Los resultados fueron: 
17, 35, 30 10, 14, 3, 21, 28, 24, 8, 6, 7, 18, 14, 35, 12, 11, 23, 19, 17, 
57, 61, 45, 23, 32. Si el valor de 30 en el puntaje del cambio es 
considerado sensitivo, en el sentido de que un alto por ciento por 
encima de este establece una situación crítica con la población de 
estudiantes, dé su valoración de la situación. 


3. Los psicóticos en una población de 100 pacientes de un hospital 
son el 25 %, los esquizofrénicos el 56 %. Haga un gráfico donde se 
refleje la distribución de frecuencias de los enfermos por afectación. 


4. Al estudiar el comportamiento efectivo de un sistema de programas 
de ayuda gráfica se entrevistaron 200 clientes de la casa que distri- 
buye el software. Ellos lo evaluaron en una escala del O al 10. Se 
obtuvo la tabla de frecuencias siguiente (ver Tabla 1.9): 


TABLA 1.9. 
Resultados de la evaluación de la efectividad de una paquetería de programas 


; , Frecuencia Frecuencia 
Frecuencia Frecuencia 


Evaluación ] absoluta relativa 
absoluta relativa 


acumulada acumulada 


Estadísticos e-B80ks e Papers 


a) Haga el gráfico correspondiente. 


b) Si una evaluación de 6 es considerada buena, diga qué opina 
sobre la valoración general de los clientes. 


5. Dibuje el polígono de frecuencias del ejemplo anterior y revalore sus 
conclusiones. E 


6. Un médico toma una muestra de pacientes jóvenes mide su tensión 
arterial máxima y obtiene la tabla de frecuencias (ver Tabla 1.10 ). Dibuje 
el histograma y dé su criterio sobre el nivel de hipertensión en el grupo 
estudiado si más de 130 es considerado delicado y más de 150 grave. 


TABLA 1.10. 
Tensión arterial máxima de los pacientes 


TEJA 80-100 | 100-120 | 120-140 | 140-160 | 160-180 | 180-200 |. 


Haga un análisis de la distribución analizando los gráficos que en- 
tienda. 


7. La comisión de garantía al consumidor lleva a cabo un estudio de 
las joyas a la venta en una zona. Para ello analiza una muestra de 
prendas seleccionadas en 20 joyerías evaluando si cumplían con las 
normas de que el contenido de oro era efectivamente 750. Ellos obtu- 
vieron que el 10 % de ellas tenían más de 750, el 85 el contenido 
establecido y el 5 % menos. Al confeccionar el informe ellos van a 

- insertar un gráfico de frecuencias. ¿Cuál propone Ud.? Hágalo. 


8. Un estudio de mercado establece que las compras en las tiendas 
libres de impuestos del aeropuerto de cognac y brandy de grandes 
marcas fueron (ver Tabla 1.11): 

TABLA 1.11... 
Compras de cognac y brandy en tiendas del Aeropuerto 


EEE 
Alba 
Número de 
hotellas compradas 
en el semestre Ú 


Haga una tabla de distribución de frecuencias y el gráfico adecuado. 
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9. Se computa el total de puntos marcados por equipos de baloncesto 
de primer nivel, en tiros libres en 220 equipos a lo largo del globo en 
la temporada previa a los Juegos Olímpicos. Compute su media. 
Los valores fueron los dados en la Tabla 1.12. 


TABLA 1.12. 
Distribución de los tiros libres exitosos en baloncesto 


por tiros libres 
 ENENENENES 


10. El tiempo semanal dedicado a la consulta de Internet para buscar 
información es medido por los administradores de la red, a peti- 
ción de los especialistas de la biblioteca central de la universidad. 
Se desea conocer la media, varianza y mediana de estos datos. 
Los resultados fueron, en horas: 


23 58 93 56 7,0 126 235 6,4 21,8 14,3. 


11. Son entrevistadas algunas las geishas de Osaka al seleccionarse 
una muestra entre las que tenían más de 15 años de trabajo en ese 
oficio. El número de kimonos que poseían fue la variable de interés 
obteniéndose la Tabla 1.13 al contabilizarles. 


TABLA 1.13. 


Número de kimonos 


Número de geishas 


Determine la media y la moda de los datos. 


12. Un libro fue enviado a varios expertos para establecer cuántos de- 
-bían distribuirse como propaganda en una población de 10 000 
lectores potenciales. El editor va a usar la media para fijar el núme- 
ro que asignará para este fin (ver Tabla 1.14). Diga cuántos utiliza- 

rá. ¿Confía Ud. en este valor? : . 
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TABLA 1.14. 
Distribución de los libros como promoción 


serio MOE ENE 
A rd 


13. ¿Quiénes son más variables en el ejercicio anterior: los libros, los 
expertos, o los criterios de los expertos? 


14. Los autos vinculados con la actividad de gerentes son estudiados. 
Se mide los kilómetros recorridos por estos en un año. Así se obtie- 
nen los resultados siguientes entre los gerentes de una cadena 
hotelera, reflejados en la Tabla 1.15 de frecuencias. . 


TABLA 1.15. 
Kilometraje de los autos de los gerentes 


Kilómetros recorridos en un año Número de gerentes 


i 


Halle la media y la varianza de estos datos. Represéntelos con un gráfico. 


15. La red hotelera Helechos Rosa evalúa la calidad del servicio de sus 
establecimientos en una escala del O al 100. Los resultados en una 
muestra de clientes son tabulados (ver Tabla 1.16) y se obtiene: 


TABLA 1.16. 
Calidad del servicio de hoteles 


Número de hoteles | 
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Determine una medida de posición que considere adecuada para 
caracterizar la calidad del servicio. Justifíquelo. 


16. Al implantar un nuevo servicio de control del desvío de recursos en 
una entidad procesadora de productos cárnicos, se obtuvo que fue- 
ron detectadas al cabo de un semestre las sustracciones siguientes: 


O 


Determine la media y la mediana, así como el error con que Ud. 
caracterizaría la valoración de las sustracciones detectadas. 


17. Para valorar la mortandad de los gnomos después de la Gran 
Orcadacia se realiza un censo en la aldea de Gtolar y se obtuvo 
que las edades eran: 


123 34 56 45 147 12189 9477 94158 234 84 75 61 168 49 
215 46 89 45 124156 187 141 158 100 91 154 167 63 128 149 
156 189 234 158 264 235 125 268 


Analice la distribución de frecuencias determinando la media y la 
varianza de estos. 


18. El número de personas que son traumatizadas durante las Fiestas 
de San Fermín por participar en las novilladas, es estudiado al ha- 
cer un recuento de ellas en los últimos 20 años. Se recogen estos 
datos en la Tabla 1.17. 


TABLA 1.17. 
Heridos en las fiestas de San Fermín 


Clases [160 170[ | [170 1801 | [180 190[ | [190 200[ 


Halle la media y la mediana. 


19. Determine la desviación absoluta media usando la media y la me- 
diana en el ejercicio 16. Diga qué opina sobre el problema analiza- 
do usando esta nueva información. 


20. Se hace un estudio similar al del ejercicio 17 entre los gnomos de 
Brutjlar y se obtiene una vida media de 135,8 años con una varianza 
de 239,51. ¿Hay mayor variabilidad relativa en esta aldea que en Gtolar? 
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21. Se realiza un estudio sobre la salud de niños entre 5 y 10 años. Se 
hace un conteo de los millones de glóbulos rojos, en vez del usual 
estudio de hemoglobina. Se obtuvieron los resultados siguientes: 
6,0 3,2 2,1 2,1 38 4,7 2,8 3,8 3,5 4,0 4,4 4,5 3,6 2,8 3,6 1,6 1,5 2,7 
2,2 5,7 36 5,4 34 2,2 39 58 4,5 2,1 3,5 5,1 6,7 3,8 6,0 3,5 4,5 6,7 
45 33 4,4 4,11 36 30 35 5,1 2,0 34 48 3,01 28 3,9 3,4 4,6. 
Haga una descripción del estudio, determinando las medidas de 
dispersión y posición más notables. ¿Qué valor reportaría usted 
como más confiable, para tipificar los glóbulos rojos en la sangre 
de los niños estudiados? Justifique su respuesta. 


22. Se hizo un estudio sobre la necesidad de empastes dentales, para lograr 
una adecuada masticación entre mayores de 20 años en una población de 
10 000 habitantes (ver Tabla 1,18). Los resultados fueron en una muestra. 


TABLA 1.18. 
Necesidades de empastes por persona 


as TS 
e Aia Ss 


Halle el séptimo decil y el 0,95 percentil. 


23. La hija del Dr. Doolite dice que ella puede jugar el mismo rol que su 
padre en la interpretación del lenguaje animal. Se hace una prueba 
y se mide el número de faltas que comete. Se obtuvo la Tabla 1.19. 


TABLA 1.19. 
Errores cometidos por la hija del Dr. Doolite 


a) Halle las medidas de posición que considere necesarias. 


b) Diga si considera adecuado decir que 3 es un número adecuado 
para caracterizar los errores que comete ella. 


24. La fiabilidad de una computadora es medida en los miles de horas 
que trabaja sin fallo. En un censo en una empresa se obtuvo que 
las computadoras dadas de baja tuvieron como tiempo de trabajo 
sin fallos con un mínimo de 10 000 y un máximo de 40 000. Este 
estudio generó la Tabla 1.20. 
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TABLA 1.20. * 
Horas de trabajo sin fallos de computadoras 


Tiempo [10 000 [16 000 (22 000. [28 000 [34 000 
sin fallos 16 000[ 22 0001 28 0001 34 000[ 40 000[ 
Número qa 
de compu- 135 215 320 225 105 
tadoras 


a) ¿Cuál es el tiempo promedio de trabajo sin fallos de las 
computadoras? 


b) ¿Cuál es el tiempo que más frecuentemente trabajan las 
computadoras sin fallos? 


c) ¿Es representativo el promedio obtenido? 


25. El tiempo de espera de un ómnibus es estudiado por los especialis- 
tas en viales de una municipalidad. Los resultados son brindados a 
un equipo de sociólogos y psicólogos, quienes computan un índi- 
ce de agresividad de 150 usuarios. Este depende del tiempo de 
espera computado, y fue (ver Tabla 1.21): 


TABLA 1.21. 
Índice de agresividad provocado por la espera del ómnibus 


Índice de Ñ 
agresividad [10 40[ | [40 80[ | [80 120[ | [120 160[ | [160 2001 
personas 


¿Qué diría usted sobre este fenómeno, haciendo uso de las medi- 
das estadísticas? 


26. Después de efectuar un cursillo de entrenamiento para guardias 
forestales, se les somete a la búsqueda en mapas de puntos des- 
conocidos para ellos. El tiempo utilizado en minutos para hallarles 
fueron (ver Tabla 1.22): 

TABLA 1.22. 
Tiempo utilizado en hallar un punto en el mapa 


Rapa pepepapa 
pps Peaje 
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a) Calcule la media, la mediana y la moda. 
b) ¿Qué puede decir de esta distribución de frecuencias? 


27. En un estudio de mercado se interrogan clientes habituales de una 
tienda por departamentos. Ellos deben expresar cómo valoran las 
mejoras introducidas en términos porcentuales. Al final de la encuesta 
se obtuvieron los resultados, los cuáles se exponen en la Tabla 1.23. 


TABLA 1.23. 
Valoración del efecto de las mejoras introducidas 
en una tienda por departamentos 


mas os Le [6 Ls [a [az 
CONE EEE 
Pa [129] 50 [12| 35 [58 00 [15 [01 [021 
[65 T262] 4 150] 94 ]75] 52] 06 [159] 108 


a) Determine la media y la moda. 
b) Diga que opina de la distribución observada. 


28. Halle la mediana en el ejercicio anterior y diga si mantiene el criterio 
que fijó al analizar media y moda. 


. 29. En un colectivo de trabajadores se valora la confianza en los diri- 
gentes administrativos de su empresa. Esta se valora en una esca- 
la del O al 100. Los resultados fueron, al fijar amplitudes de 10 pun- 

tos, los dados en la Tabla 1.24. 


TABLA 1.24. 
Valoración de la confianza en los dirigentes administrativos de un colectivo 


TM (20, 30[ | [30, sa [40, SO[ | [S0, 60[ | [60, 70[ 


Trabajadores 


que dan esa 
calificación 


a) ¿Cuál es el valor más frecuente de la calificación? 
b) Halle el primer cuartil.. 
C) Halle el percentil de orden 0,15. 
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30. En un campeonato de fútbol se analiza el número de goles por 
juego. Estos fueron presentados en la Tabla 1.25. 


TABLA 1.25. 
Goles apuntados por juego en un campeonato de fútbol 


Número 
de goles 


a) Halle la media. 


b) Determine el recorrido, el recorrido intercuartílico, la varianza, las 
desviaciones típica y absoluta media. 


31. En el campeonato anterior los resultados fueron tabulados en la 
Tabla 1.26. 
TABLA 1.26. 
Goles apuntados por juego en un campeonato de fútbol del año anterior 


de goles 


Diga si los resultados fueron similares a los del campeonato estu- 
diado en el ejercicio 30. 


32. Se analiza el coeficiente de destreza para reparar circuitos electró- 
nicos. Se toman los alumnos entrenados por dos métodos y se 
obtuvieron los resultados dados en la Tabla 1.27. 

| TABLA 1.27. 


Valoración de la destreza para reparar circuitos ' 
por dos grupos de alumnos entrenados con dos métodos 


MÉTODO 1 MÉTODO 2 


Valor del Valor del 


a AREA Frecuencia 
coeficiente coeficiente 


Frecuencia 
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a) ¿Qué método produce resultados más homogéneos? 


33. Se hace una encuesta entre 100 jóvenes y estos reportan el por 
ciento de su salario gastado en cigarros y bebidas alcohólicas. Ha- 
lle el recorrido intercuartílico. 


TABLA 1.28. 
Gasto en bebidas y tabaco 


Por ciento [0, 1O[ [10, 20[ (20, 301 


34. Usando los resultados del ejercicio 32, halle para el método 1: . 
- a) ¿Cuáles son los percentiles de orden 0,85? 
b) Halle el recorrido 'intercuartílico. ¿Qué podemos decir? 


c) Haga el mismo análisis para el ejercicio 33. 


35. El número de libros en préstamo es analizado y se obtuvo el tiempo. 
que estos están fuera de fecha de entregas. Se obtuvo la siguiente 
tabla de frecuencias 1.29: 

TABLA 1.29. 
Distribución del tiempo de desface entre la fecha 
de entrega planeada y deudas 


Intervalos 220, 30[ [30, 401 [40, SO[ [S0, 60[ 


Halle la media, la desviación típica y el cuartil de segundo orden. 


36. Los incrementos en los salarios debidos a primas de sobrecumpli- 

- miento de los empleados de una empresa, son analizados en una 
muestra de 100 semanas. Así, se obtuvo la Tabla 1.30. Halle la me- 
dia y diga si opina que esta es una buena medida para caracterizar 
estos incrementos. 


TABLA 1.30. 
Incrementos en los salarios debidos a primas 
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37. Se introducen cambios en el control en la empresa del ejercicio 
anterior, y se vuelven a medir los incrementos en los salarios debi- 
dos a primas de sobrecumplimento de los empleados. Ahora, es- 

“tos aparecen en la Tabla 1.31. ¿Bajo qué régimen hay menor ho- 
mogeneidad? Si Ud. es el empresario, ¿cuál prefiere? 


TABLA 1.31. 
incrementos en los salarios debidos a primas 


Incrementos 


Fre cuencia 


38. Se analiza el número de iteraciones que necesitó un algoritmo 
para obtener la solución óptima utilizando una heurística basada 
en Algoritmos Genéticos. Estas fueron, en 40 ejemplos de prueba 
los dados en la Tabla 1.32. Halle el coeficiente de variación. 


TABLA 1.32. 
Número de iteraciones para obtener el óptimo 


lteraciones 


Veces 


39. Una muestra de 100 carneros es seleccionada y se evalúa el peso 
de carne limpia. Se obtuvieron los resultados que se exponen en la 
Tabla 1.33. Halle el recorrido intercuartílico. 


TABLA 1.33. | 
Pesos neto de carne en 100 carneros 


coros EEE E 


Número de 
animales 


40. Se recoge información sobre los ingresos per cápita mensual de 
los trabajadores de dos hoteles, a partir de las propinas obtenidas 
. (ver Tabla 1.34). Estos fueron: 
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TABLA 1.34. 
Ingresos en dólares de empleados 
de dos hoteles por concepto de propinas 


ESOS [40, | [80, [120, [160, -[200, [240, | (280, 
: 5 80[ | 120[ | 160[ | 200[ | 240[ 280[ 320[ 
vo: ETE EN 


a) Determine el salario promedio, la moda y la mediana en cada 
hotel. 


b) ¿En cuál de ellos es más representativa la media y la mediana? 
c) ¿Cuál es el percentil de orden 0,90 en cada uno? 
d) Determine los recorridos intercuartílicos. 


41. Tres baloncetistas son evaluados a partir del número de tiros libres 
que encestan en 20 intentos. Los resultados fueron: 


B1: 10, 4, 10, 10, 10,10,13, 10, 16, 7, 7, 7, 13, 13. 

B2: 2,0, 2,2, 1,2, 1,2,1,2,3,3,3, 4. 

B3: 1,5,5,7,7,5,5,3,9,5,3,3, 7. 

a) ¿Qué jugador es menos variable en sus tiros libres? 
b) ¿Qué jugador Ud. preferirá? 


42. En la población penal de una provincia se miden las edades de 40 
reclusos con trastornos auditivos. Los resultados fueron: 


"Halle la media, la mediana y la moda. Determine el recorrido 
intercuartílico. 


43. Halle la desviación típica y la desición absoluta media del ejerci- 
cio anterior. 
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44. La prueba de capacidad auditiva fue repetida en otras dos provin- 
cias. Los resultados obtenidos aparecen en la Tabla 1.35. 


TABLA 1.35. 
Edad de presos con problemas auditivos en dos provincias 


vos» MOE MC 
civic» MOE ACTO EC E 


a) ¿En cuál provincia la edad promedio es menor? 


b) ¿En cuál provincia la edad promedio es más representativa de la 
de cada preso individual? 


45. Un análisis del tiempo que los niños usan antes de acostumbrarse 
al uso de prótesis dentales correctivas, lleva a la Tabla 1.36. 


TABLA 1.36. 
Tiempo transcurrido entre el comienzo de uso de prótesis dentarias y su 
no rechazo 


Número 

de días [10 16[ | [16 22[ [22 281 (28 34[ | [B4 401 

de niños 

Halle la media y la moda. ¿Aceptará Ud. 25 como un valor adecua- 
do para caracterizar el comportamiento de los niños? 


46. Un cantante valorará la compra de un nuevo CD que ha sido 
promocionado en su gira por Europa. Se visitan tiendas especiali- 
zadas en 10 países y se obtuvo que las ventas en el primer mes 
fueron: 12, 3420, 5, 6, 41210, 20, 7, 3, 15, 6, 7, 2, 5, 11. 


a) Construya la tabla de frecuencias y el histograma correspon- 
diente y halle media, moda y mediana. 


b) ¿Cuál de estas medidas usaría para promocionar los resultados 
de la gira, tomando en cuenta la precisión? 


c) Determine el percentil de orden 0,90. 
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Respuestas 


1. G1 establece clases de amplitud diferente y se sobrelapan las clases 
3 y 4, G2 no cubre todos los posibles resultados al fijar como enteros 
las cotas, G3 no tiene clases de igual amplitud y G4 es la aceptable. 


2. Hacemos la tabla de distribución de frecuencias y observamos que 
la frecuencia relativa con que el nivel del impacto es menor que 30 
es de 0,35, por lo que es preocupante la situación. 


4. a) Usamos el histograma y tenemos el gráfico de la Figura 1.4: 


MW Serie 1 


Frecuencia relativa 


Evaluación 
FIGURA.1.4. Histograma del ejercicio 4. 


b) Es muy mala, pues la frecuencia relativa acumulada en 6 es de 
0,80. : 


12 


MW Serie 1 


" Frecuencia relativa 
acumulada 


E 
ob a a 


1.2.3.4. .5 6 7'8 9. 10 
. Evaluación 


FIGURA 1.5. Distribución de los datos del ejercicio 4. 
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. Este está en la Figura 1.6. 
60 
40h 

MW Serie 1 


Frecuencia absoluta 


Trastornos 
FIGURA 1.6. Distribución de los datos del ejercicio 4. 


5. Sigue siendo la misma, pero esto lo obtengo al fijarme que la ma- 
yor parte del área bajo el polígono está en el intervalo [0,6|[. 


7. Este es el gráfico de barras en la Figura 1.7. 


bsolutas 


1as a 


Serie 1 


Frecuenc 


Marcas 
FIGURA 1.7. Compras de cgnac y brandy en el aeropuerto. 


9. Son 58, 864, 75, 75 y 65. 
12. Como la media es de 26,8 debe usar 27. La varianza es de 85,7 y la . 


desviación típica 9,3, o sea, hay más de un 30 % de coeficiente de 
variación. La desviación media es de 7,4 que es considerable también. 


13. La variable es el número de libros; las frecuencias están calculadas 
sobre la muestra de expertos, por tanto, esa variabilidad refleja 
que los expertos tienen criterios muy diferentes sobre el monto de 
los libros a distribuir. 
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24. 


26. 


els 
29. 


a) 24700 b) 25 068,2 c) La desviación típica es 7 092,9 por lo que 
es muy variable el tiempo respecto a la media. 


a) 12,9 12,5 y 12. b) Alrededor de 12 es un valor adecuado para 
caracterizar el centro de ella, pero la misma está deformada hacia 
la derecha. : 


a)1,64 0 y 0. b) Está deformada hacia la derecha. 
a) Como x“,= 40 esta es de 44,29, b) Como x”,= 50 este es 51,67, 


c) Ahora x”, = 20 y este percentil es 26,6. 


30. 
32. 


34. 


36. 


a) 5,74 b) 4; 2; 1,21; 1,10 y 0,93. 


a) El método 1 tiene media 9,1 y desviación típica 1,1. El segundo 
11,1 y 1,1. Por tanto, es más homogéneo el segundo método. 


a) 10; b) como los cuantiles de 0,25 y 0,75 son 9 y 10 este es 1. 
Podemos decir que entre 9 y 10 está el 75 % de los entrenados. 


El incremento medio es de 98,2 y el coeficiente de variación es 


- de 1,89; lo que es muy alto. 


38. 
39. 
41. 


0,32. 
Como los cuartiles son 41 y 35 es 6. 
B1 tiene media 10 y desviación 3, siendo CV1=0,3; B2 tiene media 


- 2 y desviación típica 1, por lo que CV1=0,5; para B3, 5, 2 y 0,4 son 


42. 
44. 


45. 


los resultados. Por lo que B1 es el menos variable y el preferible. 
56, 15, 58 y 58. El recorrido intercuartílico es 6. 


Para ambas, la edad promedio es 47,75; pero para: la primera, la 
varianza es 33,69. Y para la segunda, 62,44. Por tanto, nuestra 
preferencia es para la primera en términos de la dispersión. 


La media es 24,7 y la moda 25,01. Si lo aceptaría. 
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Capítulo 2 
Teoría de Probabilidades 


2.1. Definiciones de probabilidad 


En muchos problemas de la ciencia, la técnica y de la vida económica es 
frecuente que se requiera la realización de experimentos. Estos son 
denominados aleatorios cuando son repetibles bajo condiciones análo- 
gas y, en cada repetición del mismo el resultado es impredecible. Aun- 
que las ideas más intuitivas se asocian a los fenómenos de los juegos 
de azar, estos fenómenos están presentes en toda la actividad humana. 


Es claro que al lanzar un dado no podemos prever cuál será la cara a 
observar, pero es sorprendente que esto ocurra de manera similar en 
muchos fenómenos. 


Definición 2.1. Sea un experimento aleatorio. El conjunto de todos los 
posibles resultados de este se denomina espacio muestral, y lo deno- 
tamos por S. Un suceso aleatorio es cualquier subconjunto de S. 


Otra forma de plantear esta definición está dada por definir.el conjunto 
de todos los posibles subconjuntos de S y denotarle como IT(S). Un 
evento aleatorio es un elemento AeTT(S). 


Ejemplo 2.1. Al lanzar una moneda al aire, podemos observar Cara (c) 
o Cruz (x). Entonces, S=(4C, x] y P(S) = (fc), Lc,xP, 10H, donde 4 
denota el conjunto vacío. 


Los sucesos formados por un resultado individual del experimento alea- 
torio es llamado “suceso elemental”. Un evento A está compuesto por 
uno O varios eventos elementales. En el Ejemplo 2.1 c yx son sucesos 
elementales. q representa el suceso imposible (nunca se observa) y ' 
[c,x) el suceso seguro (siempre es observado). Por otra parte, si A es 
un evento, A*=SÍA es su complemento. Se dice que A ocurre si ob- 
servamos uno de los eventos elementales que contiene. 


Estadísticos e-Books € Papers 


Ejemplo 2.2. Lanzamos una moneda dos veces al aire. En este caso 
S = ([£c,c4, (0,4, LC), (xP) si definimos: 
A = Aparece al menos una Cc = ([f[c,C), (C,xP, (x,CY). 


De acuerdo con la estructura dada a los sucesos, podemos utilizar la 
Teoría de Conjuntos para hacer operaciones con ellos. Algunos suce- 
sos notables son: 


- El evento C definido como “ocurre A o B” es el suceso suma: AUB= A+B, 
- El evento C definido como “ocurre A y B” es el suceso producto: A=B= AB. 
- El evento C definido como “ocurre A o no B” es el suceso : AIB. 
Ejemplo 2.2. Al lanzar 2 dados tenemos: 


S = (11,1), (1,2), (1,3), (1,43,41,5), (1,6), (2,1), (2,2), (2,3), (2,4), 
12,5), (2,6), (3, 1), (3, 2), (3, 3), (3, 4), (3,5), 13,6), (4, 1), (4, 2), 
14, 3), (4,4 $, (4,5 y, (4,6 ), (5,1), (5, 2), (5, 3), 15, 4), (5, 5), (5,6), 
[6,1), (6,2), (6,3), (6,4), (6,5), 16,6)). 


"Sea el suceso: 


A = los dos resultados son iguales = ((1,1), (2,2), (3,3),14,4), (5,5), 
16,6)) 

B = los dos resultados son pares = ((2,2), (2,4), 12, en (4,2), 14,4), 
14,6), (6.2), 16,4), (6,677 


C =las dos caras son iguales o pares = AUB = ((1,1), (2,2), (3,3), 
14,4), (5,5), (6,6), (2,4), 12,6), 14,2), (4,6), (6,2), (6,43) 


Por su parte, el evento 

D = los dos resultados son iguales y pares = ANB = (12,2), 14,4), (6,6)) 
y l 

E = son iguales y no pares = AIB = (£1,1), (3,3), (5,57). 


El interés por la Teoría de las Probabilidades se puede trazar en la 
época del Renacimiento en la correspondencia del caballero de la Mére 
con Blaise Pascal, y de este, con Pierre de Fermat. 


La llamada Definición Clásica de Probabilidad es debida a Laplace. 
Esta es: 


Definición 2.2. (Definición Clásica de Probabilidad). 


Sea un experimento aleatorio en el que todos los sucesos elementales 
poseen la misma probabilidad de ser observados. Si hay N eventos 
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elementales en S y el número de ellos que representan al suceso A es 
N, la probabilidad de observar A es : 


- PA) =N/N. 


Ejemplo 2.3. Al utilizar los datos del Ejemplo 2.2, tenemos que cada su- 
ceso elemental tiene probabilidad P(e) = 1/36 y P(A) = 6/36, P(B) = 9/36, 
P(C) = 12/36, P(D) = 3/36 y P(E) = 3/36. 


Veamos otro ejemplo: 


Ejemplo 2.4. En una consulta hay 12 pacientes esperando turno. De 
ellos 5 están aquejados de gripe (G), 3 se quejan de la circulación 
sanguínea (C), 2 tienen dolores reumáticos (D) y el resto viene a che- 
quear su tensión arterial (7). Entonces ponemos sus nombres en una 
bolsa y pra uno de ellos nina de mezclar bien las fi- 
chas. S = [G,, G,, G,, G,, G¿, C,, Cor Co Ta). 


La probabilidad de 

A = el seleccionado tiene gripe es: 

P(A) = 5/12 

la de 

B = tiene problemas reumáticos o circulatorios es: 
P(B) = 5/12 

y la de 

F = no tiene una enfermedad infecciosa es: 

P(F) =7/12. 


Si los eventos elementales no son equiprobables, es necesaria otra defini- 
ción de probabilidad. Una que se vincula con la observación del experi- 
mento es la definición frecuencial. En ella se mide cuantas veces se obser- 
va el suceso A al realizar n experiencias. Si este ocurre en n, ocasiones: 


- Definición 2.2. (Definición Estadística o Frecuencial de Probabilidad). 


Si se hacen n repeticiones de un experimento aleatorio y el suceso A 
- es observado n, veces, 


FA) = n,/n 
es la probabilidad de A. 
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Ejemplo 2.4. Si no sabemos qué dolencia aqueja a los enfermos que 
acuden a la consulta de un hospital, debemosfaplicar la definición an- 
terior. Tomamos una muestra: 


Paso 1. Seleccionamos un nombre y se pregunta al paciente cuál es su 
enfermedad. 

Paso 2. Se repite el proceso n veces después de reponer la tarjeta del 
paciente seleccionado. 

Sin = 100 y obtenemos (ver Tabla 2.1): 


TABLA 2.1. 
Resultado del muestreo de 100 pacientes 


Número EN 
pacientes 
A 


Esta definición permite utilizar f(A) para hacer generalizaciones sobre 
el fenómeno estudiado. Esto es soportado por un resultado muy im- 
portante conocido como Ley de los Grandes Números. 


Definición 2.3. Todo evento A se asocia a un número P(A), llamado 
probabilidad de observar A. Si un experimento aleatorio es repetido n 
veces y este es una valor grande, entonces: 


F(A) = número de veces en que Á es observado/n = n, /n 
estará más cerca P(A) mientras mayor sea n. 
Esto significa que: 
Mm _.JA)=P(A) 
Ejemplo 2.5. Durante los últimos 15 años en una especialidad universi- 
taria se ha obtenido que el 70 % de los alumnos han aprobado Estadís- 


tica, el 80 % Inglés y el 95 % todas las asignaturas. En esos años se 
han evaluado bajo condiciones similares 1 782 alumnos. Por tanto: 


f (Estadística) = 0,7; f (Inglés) = O y f (todas) = 0,95; 
deben estar cerca de las verdaderas probabilidades. 


Los resultados asociados a estas definiciones tienen un campo limita- 
do de aplicación. La axiomatización del concepto de probabilidad ha 
permitido su uso universal. 
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Definición 2.4. (Definición Axiomática de Probabilidad). 

Una probabilidad es una aplicación P:IT(S)>K tal que: 

1. Para todo Ae IT(S) se tiene que (P(A)e [0,1]). 

2. II(S) = 1. 

3. Para todo par de eventos A y BelTT(S) tales que AMB = q 
P(AUB) = P(A) + P(B) 


Podemos reseñar algunos resultados deducibles a partir de estos axio- 
mas: : 


1. Regla del Complemento. 


Si A* es el suceso “no ocurre 4” entonces P(A*)=1 —P(A) y se deno- 
mina “complemento de 4”. 


2. P(4)=0 y d se representa al “suceso imposible”. 
3. SiA CB entonces abs < P(B). 


— PAUB) = P(A) + P(B) - P(ANB) 
Ejemplo 2.6. Un inversionista posee acciones en dos empresas. La 
probabilidad de que la empresa A le reporte dividendos mayores que 
- el 15 % es de 0,7. Esta es una empresa de servicios. La de que esto 
ocurra con la otra es de 0,8. Si se valora que ambas les generan en 6 
de cada 10 veces, la probabilidad de no obtener esas ganancias con 
sus inversiones en la primera empresa es: 
P(A*) = 1 -P(A) = 
La de obtener las ganancias fijadas es: 
P(AUB) = P(A) + P(B) - P(ANB) = 0,7 + 0,8 - 0,6 = 0,9 
Si una cadena de cafeterías forma parte de la empresa A, podemos 
decir que la probabilidad de que esta obtenga los beneficios analiza- 
dos es menor que 0,7. 
Al poseer información sobre los resultados del experimento podemos 
revisar la probabilidad de observar otro cierto evento. Esta es llamada 
la “probabilidad condicional”. 


- Definición 2.5. La probabilidad de que ocurra un evento A condicio- 
nado a que ocurrió otro B, es denotada por:  ” 


P(AlB) = PANBYP(B) si P(B) > 0 
y se denomina “probabilidad condicional de A dado B”. 
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0) sea que: 


P(ANB) = P(A|B)P(B) si P(B)>0 y P(ANB) = P(BÍA)P(A) si P(A) > 0 
Esto permite introducir el concepto de independencia estadística: 
Definición 2.6. (Independencia). 

Se dice que A y B son independientes si P(ANB) = P(A)P(B). 


Ejemplo 2.7. Un comprador conoce la calidad de la producción de un 
campesino en términos de la frecuencia con que se relaciona su oferta. 
Esta es: 


La probabilidad de que al seleccionar aleatoriamente una fruta esta 
esté madura es: 

P(M) = P(F1 y MoF2 y M). 

Como los sucesos “el mango está maduro' y “la naranja está madura' 
son mutuamente excluyentes por el Axioma 3, 

P(M) = 0,02 + 0,28 = 0,30. 

Si seleccionamos al azar una fruta y sabemos que es una naranja, la 
probabilidad de ella estar madura es: 

P(M|F2) = P(MAF2)/P(F2) = 0,28/0,84 = 0,3. 

Otra ilustración de la importancia de este concepto se obtiene en el 
ejemplo siguiente: 

“Ejemplo 2.8. En un grupo de discusión hay 30 personas, de las cuales 
5 son fanáticos del rock, 20 de la salsa y 5 de la música clásica. Se van 
a entrevistar dos personas y para ello se seleccionan aleatoriamente, 
sin reemplazo, la probabilidad de que la primera prefiera el rock y que 
la segunda la música clásica es: | 
P(R, y C,) = P(C,|R)P(R,) = (5/29) (5/30) = 25/870. 

y de que fueran de Salsa y Rock 
P(S, y R,) = P(R,|S.)P(S,) = (5/29) (20/30) = 100/870. 
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Si no nos interesa el orden tenemos que calcular: 

P(IR, y C.] o [C, y R,)) = P(C,|R,)P(R) + P(R,|C.)P(C,) = 25/870 + 
25/870 = 50/870. 

P(IS, y R,] o [R, y S,]) = P(R,|S.)P(S,) + P(S,|R )P(R,) = 100/870 + 
100/870 = 200/870. 

La probabilidad será: 

P(IR, y C,] o [S, y R,]) = P(C,|R )P(R,) + P(R,|S.)P(S,) = 25/870 + 
100/870 = 125/870. 

Si la selección se hace con. el reemplazo de cada unidad seleccionada 
previo a la selección de la otra, hay independencia y: 

P(R, y C,) = P(C)P(R,) = (5/30)(5/30) = 25/900. 

P(S, y R,) = P(RJP(S,) = (5/30)(20/30) = 100/900. 

P(IR, y C,] 0 [C, y R,]) = 25/900 + 25/900 = 50/900. 

P([S, y R,] o [R, y S,]) = 100/900 + 100/900 = 200/900. 

P([R, y C,] o [S, y R,]) = 25/900 + 100/900 = 125/900. 


2.2. Variables aleatorias 


2.2.1. Generalidades 


ción nur — — a. Por Elmo, a er dos dados TSE interesar. 
nos s por la suma de sus caras. Entonces, los resultados ¡ son 
2,3, 4, 5, 6, 7, 8,9, 10 u 11 y 12. Entonces: 


P(2) = P(sale [1,1]) = 1/6 

P(3) = P(sale [1,2] o [ 2,11) = 2/6 

P(4) = P(sale [2,2], [3, 1] o [3,1]) = 3/6 

P(5) = P(sale [1,4], [2,3], [3,2] o [4,1]) = 4/6 

P(6) = P(sale [1,5], [2,4],-[3,3], [4,2] o [5,1]) = 5/6 
P(7) = P(sale [1,6], [2,5], [3,4], [4,3], [5,2] o el [6,1]) = 6/6 
P(8) = P(sale [2,6], [3,5], [4,4], [5,3] o [6,2]) = 5/6 
P(9) = P(sale [3,6], [4,5], [5,4] o [6,3]+ = 4/6 
P(10) = P(sale [4,6], [5,5], o [6,4]) = 3/6 - 

P(11) = P(sale [5,6], o [6,5]) = 2/6 

P(12) = P(sale [6,6]) = 1/6 
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Podemos identificar tales resultados con una variable de naturaleza 
aleatoria. Formalmente esta es una función. 


Definición 2.7. (Variable aleatoria). 


X:I1(S)>%X tal que X(4) es un número real si Ae IT(S) es una variable 
aleatoria. 


Ejemplo 2.9. “X = suma de las caras de dos dados” es una variable 
aleatoria y: 


P(X = 5) = 4/6 

P(X = 40X= 6) = 3/6 + 5/6 
P(X < 4) = 1/6 + 2/6 = 3/6 
Hay dos tipos de variables: 


Definición 2.8. Si podemos listar todos los posibles valores de una 
variable X, o si esos son a lo más contables, se dice que discreta. Si 
X puede tomar todos los valores en un intervalo real, esta es denomi- 
nada continua. 


Ejemplo 2.10. Si seleccionamos n clientes habituales del supermerca- 
do y la variable es la evaluación de cuantos poseen ingresos superio- 
res a 300 pesos per cápita, X es discreta. Si evaluáramos el promedio 
per cápita, esta es continua. 


Si pesamos a n bebés, la medición es una variable aleatoria continua, 
pero cuando contabilizamos cuántos superan el percent para su edad, . 
tenemos una variable discreta. 


El número de arribos de aviones en un día a un aeropuerto es una 
variable discreta, pero el tiempo entre ellos no. 


Si X es una variable aleatoria discreta, podemos asignarle a cada posi- 
ble valor una probabilidad. La colección de ellas es llamada distribu- 
ción discreta de probabilidad. 


Ejemplo 2.11. Son calificados 100 estudiantes y se obtienen los resul- 
tados en la Tabla 2.2 “Calificación de 100 estudiantes en Estadística”, 
donde tenemos la distribución de la variable aleatoria X = nota. 


TABLA 2.2. 
Calificación de 100 estudiantes en Estadística 


Nota (x) 


$4 de alumnos 


P(X=x) 
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Definición 2.9. Si X es una variable aleatoria discreta, su distribución de 
probabilidad es un listado de los valores de la probabilidad de cada 
posible valor o una función tal que: 
1. P(X = x) = f(x), para todo valor posible.x de X. 
2. f(x) > 0, para todo valor posible x de X (función de densidad o de cuantía). 
3. 2. f(x) = 1, donde la suma se efectúa sobre todos los valores posibles deX. ' 

y: 

PXSx) = Y .£y) = Flo 

F(d) se conoce como función de distribución. 


Ejemplo 2.12. En el ejemplo anterior la probabilidad de que un alum- 
no apruebe es: 


P(X> 2) =1- Y y) = 1-0,15 = 0,85. 

Si seleccionamos 4 aleatoriamente de forma independiente y definimos. 
X = número de aprobados. 

Los posibles resultados aparecen la Tabla 2.3 donde: 

a = aprobado. 

no aprobado 


ll 


! 


n 


TABLA 2.3. 
Resultados posibles en 4 estudiantes. 


Núme 
aprobados 


Só aann, anan, 

Posibles annn, nann, naaa, anaa, 
anna, naan, 

resultados nnan, nnna aana, aaan 


Entonces: 

P(X = 0) = P(nnnn) = (0,15)* = 0,0005 

P(X = 1) = P(annn o nann o nnan o nnna) = 4(0,85)(0,15)? = 0,0115 
P(X = 2) = P(aann o anan o anna o naan o nnaa) = 6(0,85) *(0,15)? = 0,0975 
P(X = 3) = P(naaa o anaa o aana o aaan) = 4(0,85)* (0,15) = 0,3685 
P(X = 4) = P(aaaa) = (0,85)* = 0,5220 

o dicho formalmente: 

P(X = x) = f(x) = C*, (0,85)* (0,15)** six =0,1,2,3,64. 

donde: 


Cs, = a!/(a — b)!b! representa a las combinaciones de a en grupos de 
tamaño b. 
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Nuevamente son de interés obtener medidas de posición y de disper- 
sión, como en Estadística Descriptiva. Al trabajar con la distribución de ' 
probabilidad, estas medidas no son empíricas (estadígratos), sino 
parámetros. Para el caso discreto tenemos: 


Definición 2.10. La media teórica de una variable discreta es, al sumar 
sobre todos los posibles valores de X, el parámetro: 


u=Y 40) 


la que es llamada también valor esperado, E(X), o esperanza matemá- 
tica de X, 


La varianza de ella, V(X), está dada por : 

0? =2 (1-mY fx) 
donde: 
o es la desviación típica. 


Ejemplo 2.13. Usando los datos del ejemplo sobre los estudiantes apro- 
bados, tenemos la Tabla 2.4: 


TABLA 2.4. 
Media y varianza teórica para el número de estudiantes aprobados para n=4 


Plaprobado) = P(X = 3) + P(X = 3) = f(3) + f(4) = 0,8913 


Como: 
u= Y $ (0) = 3,4017 


Este caracteriza la posición de la distribución. Así mismo, 
0? =»Y(x - uy Ax) = 0,5104 


0=0,7144 
nos miden la dispersión de X. 


2.2.2. Distribuciones de variables aleatorias discretas 


: al comprobar que estos len con ciertas condiciones. De 

hecho, podemos planear experimentos aleatorios que las satisfagan. 

Un primer modelo es el experimento Bernoulli. Este es caracterizado 
porque sólo dos resultados son posibles: A y su complemento A*. 


Definición 2.11. Distribución de Bernoulli: B(p) 


Sea un experimento aleatorio con dos posibles resultados A y A*.tal 
que P(A) = p y P(4*) = 1 -p = 9. X es una variable Bernoulli si 


X =1 siocurreA. . 

X = O si ocurre su complemento A*. 
y: > 

PX = x) = f(x) = p"q'*para x = 0,1 
f(x) = O en otro caso. 


siendo: . E 
EN =u4=p 
V(X) = 0? = pg 


Ejemplo 2.14. Una revista de modas tiene 5 000 suscriptores y el editor 
Opina que estos están satisfechos con la política editorial en el 90 % de 
los casos. Ésta hará una encuesta donde la pregunta: 


¿“Le gusta la revista en su estado actual”? 

mide su valoración de lo que le brindan. Entonces, tomando: 
X = 1 si responde que “sí” 
X= 0 si responde que “no” 

la distribución es: 

f(x) = (0,9) (0,1) 


En la práctica, es de interés conocer la probabilidad del número de 
experimentos en que ocurre A. Entonces, si tenemos n variables 
- Bernoulli, X mide el total de veces en que se observa el evento A, donde: 


HER 


Si las variables son independientes. 
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Definición 2.12. Distribución Binomial: B(n.p) 


Si tenemos n variables independientes con distribución Bernoulli 
X, 11. X, , tales que: 


PX, =1) =p 

entonces: 

X= aX 

posee como distribución de probabilidad 

fl) = Cr, prgr*, para x = 0,.1,...,n. 

fo) = 0, en otro caso. 

donde: 

C? =n!xU(n-x)! 

y: 

EX) = f =np 

VO) = 0? = npq. 

Ejemplo 2.15. Una revista de Biología tiene un récord de aceptación en 
primera instancia dado por “1 de 4 trabajos se aceptan”. Se seleccio- 
nan 10 trabajos aleatoria e idependientemente, entre los recién llega- 


dos a la editorial. La distribución es una B(10, 0,25). La probabilidad de 
que se acepten al menos dos de los artículos es: 


P(X>2) = 1- Y! ,f(x) = 1- [0,0563 + 0,1502] = 0,7935 
y se espera que se acepten: 


EN) = 2,5 
con una varianza de: 
V(X) = 1,369. 


Si un cambio de política determina que se aceptará el doble, esto 
significa que ahora p = 0,5 y, 


E) =5 
Vo) =2,5 
y: 


P(X>2) = 1-Y,_, f(x) = 1 - [0,0010 + 0,0098] = 0,9892. 


La Binomial es la más comúnmente utilizada distribución discreta, pero hay 
otras que son importantes en las aplicaciones. Veremos algunas de ellas. 


: 
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. Definición 2.13. Distribución Hipergeométrica: H(N,M,n) 
Si tenemos n variables no independientes con distribución Bernoulli 
X, 5..=, X, , tales que: 

P(X, = 1) = MIN 

entonces: | 

x=Y,_,X 

tiene una distribución de probabilidad: 

f(x) = CY, dió /C", , parax = 0,1,....M. 

f() = 0, en otro caso; 

donde: 

EX) =u = np 

V()= 0? =(N — n)npq/(N — 1) 


Note que M es la cantidad de unidades que poseen la propiedad de 
interés (pertenecen a A) y que si el tamaño de la población N es sufi- 
cientemente grande como para que N —n =N — 1, esta distribución es 
muy similar a la B(n,p) con p = M/N. 


Ejemplo 2.16. Un médico atiende 6 pacientes con trastornos hormona- 
les y 4 con una afección con los mismos síntomas pero de origen 
psicosomático. Seleccionará 5 pacientes sin reemplazo para someter- 
les a un experimento. La distribución del número de pacientes con 
problemas físicos es: — ' 

fo) as, c*, =X 10%, : á 
con n = 5. Si desea determinar la probabilidad de que aparezcan 3 
pacientes con trastornos hormonales esta es: 
f(3) = C*, C*,/C*, = 0,4762 


debe esperar a observar E(X) = 5(6/10) = 3 vY la desviación típica 
es y = 4,583. 


Definición 2.13. Distribución Poisson: P(A) 


Si tenemos n variables independientes con distribución Bernoulli 
X; 5...) X, , tales que: 


PX =1)=p 


45 


es muy pequeña y n grande , entonces: 
¿SIS 

posee como distribución de probabilidad 
10) =M e */x! para x = 0,.1,...,n. 


f(9 = 0, en otro caso; 


siendo: 
EV) = Anp 
VO) A A 


Ejemplo 2.17. Los mensajes arriban al servidor de una red de 
computadoras a un promedio de 10 por minuto. La distribución es una 
P(10). Por tanto, la probabilidad de que lleguen 5 mensajes es: 


f(5) = 10% e 9/5! = 0,03783. 
Otro tipo clásico de problemas es el tratado a continuación: 


Ejemplo 2.18. Se analizarán los récords de 1 000 tormentas. acaecidas 
durante el siglo pasado y se indagará sobre la coincidencia de estos 
con los días del año, asignándoles el 29 de febrero al 1 de Marzo. En 
este caso podemos usar la distribución Binomial donde p = 1/365 = 
0,002739 y q = 364/365. La esperanza del número de “éxitos” es 
A = 1000 p = 2,7397 y podemos usar para calcular las probabilidades a 
f() = 2,7397* exp(-2,7397)/x! donde: exp(a) = e*. 

La probabilidad de que entre 1 y 3 tormentas coincidan en un día es: 
P(1<X<3) = (1) + f(2) + f(3) = exp(-2,7397)[2,7397 + (2,7397)/21 + 
+ (2,7397)*/31] = 0,178 + 0,244 + 0,223 = 0,645 

Cuando en un experimento binomial los posibles resultados son más 
que dos, podemos establecer que ante cada intento se observa el “éxi- 
to” de uno de los sucesos mutuamente excluyentes: 

Asa A 

Ante cada experiencia tenemos un vector (Y, , Y, ,..., Y ) siendo cada Y, 
una variable Bernoulli con: 

P(A) =P, =1) =p, 

y: 

2 p= 1 


Al tomar una muestra de tamaño n obtenemos evaluaciones de las K 
variables. a 


X, = número de resultados en que se observa A, 


y: 
EX) =p, 
2 X= 


La distribución de probabilidad de (X,, X, ,..., X.) es descrita a conti- 
nuación: 


Definición 2.13. Distribución Mu | omial: P(n; p,, p,,....P,) 


Si tenemos K sucesos aleatorios A, ,í = 1,...K, y las variables X, ,..., X,., 


miden el número de veces con que se observan estos en una muestra 
de tamaño n satisfaciéndose que: 

PX =1)=p, 

n= 2 X, 

2 p= 1 

Yo 

E(X) =p, | 

la distribución de probabilidad de (X, ...., X,) es: 

FX, 0. X 9 MP sn px, 1... Xx! parax,=0,1,...N,1=1,...K. 


Ejemplo 2.18. En un almacén hay 100 bolsas de café de las cuales 30 
son del tipo arábigo, 50 del caturra y 20 de clase no definida. Se va a 
seleccionar una muestra de 6 paquetes aléatoriamente. La probabili- 
dad de observar 2 de arábigo, 3 de caturra y 1 del resto es: 


f(2,3,1) = 610,3? 0,5% 0,2/21311! = 0,135. 
2.2.3. Algunas distribuciones de variables aleatorias 


continuas 


Para una variable aleatoria continua se define su función de densidad 
f0o a partir de la función de distribución: 


Fl) = PX <x) =Í2 fbgak. 
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La probabilidad de que X pertenezca a un intervalo [a,b] es calculable 
a partir de la tunción de distribución pues: 


P(a < X < b) = F(b) - Fía) 
Esta es igual al área existente entre la curva descrita por f(x) y el eje de x. 


Podemos destacar algunas distribuciones para las variables continuas. 
La más simple de ellas es la uniforme. 


Definición 2.15. Distribución Uniforme: U([a,b]). 


Una variable aleatoria X sigue una distribución de probabilidad unifor- 
me en el intervalo [a,b] si: 


f(9) = 1/(b- a) cuando xe [a,b] 
f(9 =0 en otro caso. | 
Para ella: 

E(X) = u = [a + b]/2 

VOX) = 0? = [b-al? /112 

Por otra parte si [c, d]c[a, b] 
P(Xe [c, d]) = (d —c)/(b -a) 


Ejemplo 2.18. El flujo de mensajes entre dos nodos de una red de 
intranet es medido por un coeficiente de ocupación, que es una varia- 
ble aleatoria, que sigue una distribución diaria descrita por una unifor- 
me en el intervalo [5,10]. La probabilidad de que este tome un valor 
menor que 8 es: 


P(Xe [5, 8]) = (8 - 5)/(10 - 5) = 0,6 

El administrador de la red espera que sea: 

EVO = y = [5 + 10//2 =7,5 

y que la dispersión sea caracterizada por: 

VX) = 0? = [10- 5]? /12 = 2,08. 

Una distribución muy importante es la gamma definida como sigue: 
Definición 2.16. Distribución Gamma: I(a,B). 

Una variable aleatoria X sigue una distribución de probabilidad gamma si 
f09 = x*! exp x/p)/8o Ta) parax> 0 

| 


1h 


fo) =0 

en otro caso si: 

a>0 | 

B>0 

es importante recordar que: 
T(a) = (a - 1)! sia > 1 
Fa) = Vx sia = 1/2 


Para ella: 
E) =u4 =0B 
VO) = 0? = af 


Es un caso particular de la Gamma la distribución exponencial. Esta 
es de mucho interés en muchas aplicaciones y en particular en las 
tecnológicas. 


Definición 2.17. Distribución Exponencial: E0. 


Una variable aleatoria X que sigue una distribución de probabilidad 
Gamma si a. =18=1/1 y: 


f(9 =2 exp (A) parax> 0 


fx) = 

en otro caso si: 
A>0 

Para ella: 

E) =4u4=2 
VO) = 0? =P 
y: 


PX < x) = F() = 1 -exp(CA) 


Esta distribución es muy usada para modelar problemas asociados a 
tiempos de espera relacionados con frecuencias caracterizadas ppr 
una distribución Poisson con media A. 


Ejemplo 2.19. Una cafetería puede pusar al sistema de “fast food”, lo 
que implicaría una nueva organizació.1 de sus servicios. El número de 
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clientes que acuden por minuto se distribuye de acuerdo con una distri- 
bución Poisson con A = 1,2. Por tanto, el comportamiento probabilístico 
de los tiempos de espera de los clientes es modelado por: 


f09 = 1,2 exp(-1,2x) 


La probabilidad de que, en las condiciones actuales, un cliente espere 
menos de dos minutos es: 


F(2) = 1-exp (-2,4) = 1- 0,0907 = 0,9093. 


El valor de exp (-AX) puede ser obtenido de una tabla estadística o 
usando una calculadora científica. Es más usual obtener directamente 
F(9 de una tabla con las probabilidades. Vea la Tabla 2.5 o usando el 
cálculo de las probabilidades brindado por un paquete estadístico a 
través de un ordenador. 


TABLA 2.5. 
Minitabla para la Exponencial 


E) = |-exp(=1) 
f F(t) Í F(t) Í F(t) É 0) 


ia [no Pis [om e [om] do | e9s 
Pasos az Pos | as [050] 60 [ose 
Pisa Pas Pos] 59 [os | o Ju 


Menos evidente es la utilidad inmediata de la distribución Beta, pero 
esta es muy importante en la estadística. Una razón adicional para 
este hecho es su papel en la Estadística Bayesiana. 


Definición 2.18. Distribución Beta: Be(a,B). 
Una variable aleatoria X sigue una distribución de probabilidad Beta si: 
f(9 = Tía + Bix (1 — xx] dle (o) para0<x< if 
fo) =0 
| 


lo 


hi 


en otro caso si: 

a>0 

p>0 

Para ella: 

EQ) = y = Q/(a. + $) 

VX) = 0? = a8/(a + B)t(a + B + 1) 


2.2.4. La Distribución Normal y Distribuciones asociadas 


La distribución normal es la más importante de la estadística. Este he- 
cho proviene de su papel en representar multitud de fenómenos donde 
se miden variables continuas, por ser el límite de distribuciones impor- 
tantes, como la Binomial, y por caracterizar el comportamiento 
probabilístico de la media muestral. Ella depende de la media y la 
varianza de la variable. 


Definición 2.19. Distribución Normal: N(1,0”). 
Una variable aleatoria X sigue una distribución de probabilidad Normal si: 
f(x) = (20%1)"? exp £-.[(x- 1)/0]? paratodo x y o > O. 


Esta distribución posee propiedades matemáticas muy interesantes. 
Entre ellas están: 


1. Es simétrica respecto a x =h.. 

2. Su máximo está en x = u. 

3. Sus puntos de inflexión están en x' =u-oyx”=u + O. 
Entonces, si usamos la desviación típica como parte alícuota 

Z = (X-u)/o 
Sigue una distribución N(0,1) cualesquiera sean u y o. Por ello, 
FL) = PX < x) = P(Z < (x-w/0) = 0(2) 


Los valores de d(z) aparecen en tablas. Al usar un paquete de pro- 
gramas especializados, sus valores son obtenibles. A partir de sus pro- 
piedacdes, podemos utilizar las relaciones siguientes: 


1.P(uU-o0<X<u + 0) = 0,683 
.2.P(u-20 <X<u + 20) = 0,954. 
3. P(u— 30 <X < u + 30) = 0,997 
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4. P(X<u) = P(X> u) = 0,50 
5. P(X < u + to) = P(X > u — to), para todo t. 


Ejemplo 2.20. El tiempo necesario para que una rata salga de un 
laberinto para hallar su alimento es una variable normal, que debe 
tener un promedio teórico de 2,0 minutos y una varianza de 0,25. El 
biólogo calcula las probabilidades P'= P(X < 2,5), P”= P(1<X< 3) y 
P””= P(X > 2,98) a partir de que: 


z' = (2,5 - 2,0)/0,5 = 1,z,== (1,0— 2,0)/0,5 = -2 y z,= (3,0 — 2,0)/0,5- 
=2yZ”== (2,98 — 2,0)/0,5 = 1,96. 


Al usar la “Mini Tabla de la N(0,1)”, dada en la Tabla 2.6, tenemos que: 
P” = 0 (1) = 0,841 

P” = 0 (2) - F(-2) = 0,977 - 0,023 = 0,954 

P”= 1-0 (1,96) = 1 - 0,975 = 0,025 


TABLA 2.6. 
Minitabla de la Distribución Acumulativa de la N(0,1) 


Es muy importante el cálculo de percentiles para la normal. Como se 
vio en Estadística Descriptiva un percentil es: 


Definición 2.20. Al fijar una probabilidad p el percentil de orden 
p (y, = F*(p)) de una distrikución N(u,o*) es un valor tal que: 


PX< 1) =p. 


lso 


Si para la N(0,1) este se denota z, = O”'(p) 
Y, = 4 +Z,0. 


Ejemplo 2.21. El biólogo del ejemplo anterior desea hallar el percentil 
de orden 0,99 para el tiempo que demora la rata en hallar su alimento 


como Z, yy = 2,33 tenemos que: 


Yo =2 +2, 0,5 = 3,165 


La distribución Binomial puede ser aproximada con mucha facilidad 
por una normal cuando p = 0,5. Este es un resultado de Moivre, donde 
este propuso desplazar la distribución en forma tal, que se obtuviese 
una con media cero y comprimirla hasta que el área bajo la curva fuese 
igual a uno. El gráfico que se obtiene es el de la N(0, 1). Ver la Tabla 2.7 
de la Distribución Binomial para n = 10. 


TABLA 2.7. 
P(X = x) para una B(10, p) para valores seleccionados de p 


P 0 1 2 3 4 5 6 él 8 9 10 
Ls Joso]: ]o [0] 0 o] 00 | o [o] 
Jo] Joa Joao ne o [o] 
ooo for Jose esoo [on 
OOOO aan 


Como esto se evidencia: en general la distribución Binomial puede ser 
aproximada por una distribución. normal, si el tamaño de la muestra 
es suficientemente grande. 


Teorema 2.1. (Aproximación de la Binomial por una Normal). 
Sea X una variable con distribución B(n,p). Entonces: 

= (X-npjInp(t - pl" | 
tiene una distribución que se aproxima a una N(0,1) según n crece. 


Ejemplo 2.22. Un medicamento ha probado ser efectivo en la elimina- 
ción de infecciones urinarias en 6 de « ada 10 pacientes. Se seleccio- 
nará una muestra de 100 enfermos. lin este caso la muestra puede 
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considerarse grande, por lo que u = np = 60 y o? = np(1 - p) = 240 y 

la variable tipificada es: 

Z = (X- 60)/15,5 

Por tanto, al usar esta aproximación para calcular la probabilidad de 

que entre 80 y 110 enfermos se recuperen tenemos: 

P(Xe [80,110]) = P(Ze [1,29 3,23])= (3,23) - 9(1,29) = 0,9994 — 0,9015 
= 0,0979. 


El uso de una distribución continua como aproximación de una discre- 
ta, requiere de una corrección (corrección para continuidad). En este 
caso, esta consiste en utilizar x + 0,5 si calculamos P(X > x) y x — 0,5 si 
fuera P(X<x). 


Ejemplo 2.23. En el ejemplo anterior, el uso de la corrección para la 

continuidad lleva a usar: 

P(Xe [80,5 109,5]) = P(Ze [1,32 3,19]) = P(3,19) -— D(1,32) = 0,9993 — 0,9066 
= 0,0927. 

Otro resultado de vital importancia es el asociado a la distribución de 

la media muestral: 

X=Y',.,X /n 

Esta es N(u, 0?/n) si la distribución fuera normal. 

Ejemplo 2.24. El comportamiento de los valores de unos bonos en la bolsa 

se considera describible por una distribución N(2,5 4). Antes de hacer sus 

compras, un córredor tomará una muestra de 100 días de actividad bursá- 

til y desea evaluar la probabilidad de que, como promedio, este tenga valo- 

res mayores de 2,7. Como la variable es normal, su media también lo es y 

la probabilidad de que ocurra lo que indaga el corredor es: 

P(el promedio de cotización es mayor que 2,7) = 1 — F(2,7) 

Tipificando z = (2,7 - 2,5)/(2/10) = 1 

y: 

F(2,7) = O(1) = 0,841. 

Por tanto, el suceso de interés ocurre con probabilidad: 

P = 0,259 

Un resultado aún más importanje es que, a pesar de que la distribución 


no sea normal, la de la media mluestral sí puede serlo. Sólo se requerirá 
de poder afrontar la toma de unha muestra suficientemente grande. 


Teorema 2.2. Teorema Central del Límite. 


Sea X,,...X, Una muestra aleatoria independiente de una población 
infinita con: j 


E(X) = 

y: 

YX) = 0? 

para todo í = 1,...,n 
= (X- n'?/5 


sigue una distribución que es aproximadamente una N(0,1) si n=>o, 
En particular, para la Binomial n > 30 es suficientemente grande. 


Ejemplo 2.25. Un psicólogo toma una muestra de 225 pacientes y les 
aplicará un test cuya calificación en poblaciones de psicópatas, como 
la analizada, posee media de 69 y una varianza de 324. El quiere valo- 
rar qué puede esperar de la media de la muestra. Como n es conside- 
rado grande, utiliza la aproximación normal para calcular la probabili- 
dad de que esta sea menor que 70. Por el Teorema Central del Límite: 


P(Z < (70 — 69)15/18) = (0,833) = 0,7005, 
es un valor aproximado de ella. 


2.2.5. Distribuciones en el muestreo 


Al trabajar con muestras y funciones de variables aleatorias con distri- 
bución normal, tenemos que analizar cómo se distribuyen estas. Se 
asumirá que las variables son independientes y con la distribución N(u, 
0%. La distribución de la media es una M(u,o? /n), como se discutió en 
la subsección anterior. Cuando tenemos n variables Z, con distribu- 
ción N(0,1) es de interés conocer cuál es la de: 
U= Za 27 


Definición 2.21. Distribución Chi-cuadrado: x? (v) 


Una variable aleatoria U sigue una distribución de probabilidad Chi- 
cuadrado si: 


f(u) = ur -2% exp [-u/2)/2"? F(v/2) para 1: > O. 
nu 
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en otro caso el parámetro n es conocido como grados de libertad, 


donde: 

EU) =4 = yv 
y: 
V(U) = 0? = 2v. 


En particular si tenemos: 
1.n= 1 entonces v = 1. 


2. U,,...U, variables con distribución Chi-cuadrada con v, grados de 
libertad la suma de cada una: 


sigue una distribución y? (2% _, v). 


Un resultado de especial importancia es el siguiente: 


Teorema 2.3. Sea la media: 


y la varianza: 


de una muestra de tamaño n de una N(u,o?) entonces: 
1. X y S? son independientes. 
2. (n — 1)8?/0? se distribuye x? (n — 1). 


Ejemplo 2.25. Una máquina que distribuye café y el contenido de las tazas 
es supuestamente normal con una desviación típica de 5,18 y una media 
de 330 mL. Se tomará una muestra aleatoria de 12 tazas. Se obtuvo que: 


U= pa (X - 1)? a 2 z? = 40: 
Como cada Z/o es una vari4ble con distribución N(0,1) 
U = U lg? $ 


tiene una distribución de probabilidad 1é(12). Como o* = 26,83 y, sise . 
desea conocer la probabilidad de que U supere el valor observado en 
esta ocasión: 4'/26,83 = 5,22 


P(U>5,22) = 1 —F(5,22) = 1 - 0,05 = 0,95. 


El valor de F(u) es obtenido en las tablas de la Chi-cuadrado.Vea la 
minitabla dada en la Tabla 2.8, o utilice un paquete estadístico. 


TABLA 2.8. 
Minitabla de Chi-cuadrado 


> es [es [os [005 [00 


Cuando estimamos la varianza usando la media muestral solo hay n - 1 
grados de libertad. 


Ejemplo 2.26. Se tomará una muestra de 6 cardíacos crónicos, para 
evaluar la variabilidad de un monitor. Como se sabe que las medicio- 
- nes siguen una distribución normal con varianza 2,25, la probabilidad 
de que la varianza computada sea menor que 0,516 se basa en el uso de: 


gl 


97 (x, -x] 
U ds i=l 
2423 


Como esta es una variable con distribución Y (5). 
P(U < 5(0,516)/2,25) = F(1,17) = 0,05. 
Es muy frecuente que se trabaje con los percentiles de esta distribución. 


Ejemplo 2.27. En los ejemplos anteriores, podemos obtener los 
percentiles de orden 0,95, 0,975 y 0,99 fácilmente usando la minitabla 
brindada y obtenemos: 


11.07 12.832 15.086 
21,026 26017 
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. Cuando no conocemos la varianza, no podremos obtener la variable 
tipificada. La solución es usar una estimación de ella y trabajar con 


T= (X-p)n? /s 


cuya distribución fue desarrollada por W. Gosset a principios del pa- 
sado siglo. 


Teorema 2.4. Distribución T-Student: T(v) 


Sea Z una variable con distribución N(0,1) y Y otra distribuida x?(n). 
Entonces: 


T* = ZI(YN)y” 
tiene una distribución de probabilidad con densidad: 


fo=TlW + D2][1 +2 vy%+92 / (ny? T(v/2) para todo — < t £ oo 


llamada T-Student donde el parámetro v es llamado grados de libertad. 
En particular es importante cuando 7 sigue una distribución T(n - 1). 


Ejemplo 2.28. Un comerciante seleccionará una muestra de 9 clientes 
y desea obtener la probabilidad de que el gasto promedio de ellos sea 
mayor que $ 20,00. Si la varianza muestral es de 26,83 y la media his- 
tórica es de $ 15,00, tenemos que: 


t = (20 - 15)/(5,18/3) = 2,89. 


Utilizando los valores de las tablas (ver Tabla 2.9), el valor más próximo es 2,896 
y P(T < 2,896) = 0,99, por lo que la probabilidad deseada es de 0,01 
dado que v=n-1=8 
TABLA 2.9. 
Minitabla de T-Student 


p=0,90 | p=095 p=0,975 | p=0,99 


1,476 2,015 E! 3,365 | 
1,397 1,860 2,306 2,896 
, 1,363 1,796 2,201 2,718 


Por último nos interesará er de la razón de dos variables 
¡ 


Chi-cuadrado divididas por s]is grados de libertad. 


] 


Teorema 2.5. Distribución de Fisher : F(v', v*). 


Sean U y V dos variables independientes con distribuciones EVO y 
x¿(vs). La razón, 


F=(UNIMIVNS 


tiene una distribución de probabilidad con densidad: 
AE) =I[W + v9/2](v/v9v2 FR (1 + VE) 09% Tv od “) paraF>0 
f(F) = 0 | 
en otro caso. 
Un caso particular es aquel en que tenemos dos variables aleatorias 
independientes X y Y, y tomamos muestras de tamaño n y m. cuyas 
varianzas muestrales son s%, y s?, . Si las poblaciones poseen distri- 
buciones N(u,,02) y N(u, ,0?,) tendríamos que : 

UN'=8 10?, 

Viv“ =s,/0?, 
Por ello: 

F=9,0?,/9,0?, 


sigue una distribución F(n — 1 y m- 1). 
Note que si o, = 6, no es necesario conocer sus valores para computar F. 


TABLA 2.10. 
Minitabla de la F(v',v*) para P(F>09, o) 


£ 


NY 


yo 1 5 Ú 20 
a [ie | mo | 2 | 2 | 


Ejemplo 2.29. Se considera que las varianzas de las ventas de dos 
supermercados son iguales y que la cor ¡pra de los clientes sigue una 
distribución normal. Se desea saber, al >mar muestras de 10 clientes 
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en cada uno en forma independiente, cuál es la probabilidad de que 
una de ellas no sea 3 veces mayor que la otra. Como P(F>2,98) = 0,05 


La probabilidad deseada es: 
P(s? /s%, < 3) = 0,95 


2.2.6. El Teorema de Bayes 


En muchos problemas la mejor forma de enfocarles es utilizando el Enfo- 
que Bayesiano. En el caso más simple este se asocia al siguiente Teorema: 


Teorema 2.5. (Regla de la probabilidad Total). 


SeaA, ,..., A, una partición del espacio muestral [u,_,*A, =S y para 
todo / + j se tiene que A/M, = 4] y P(A) + O. Entonces, para todo 
evento B de S, podemos calcular su probabilidad utilizando: 


P(B)= Y, PA)PBÍA) 


A partir de este tenemos: 
Teorema 2.6. (Teorema de Bayes). 
Sea A, ,..., A, Una partición del espacio muestral [2*,_, A, = S y para 


todo í + j se tiene que ANA, = Q] y P(B) + 0. Entonces, para todo 
evento B de S, podemos calcular: 


P(A, 18) = PA)P(BÍA)! Y, PA)YPBÍA) 


Ejemplo 2.30. Una prueba para detectar seropositivos califica con una . 
frecuencia del 0.99 a los individuos que lo son y mal clasifica a los 
sanos con una del 0,02. Tenemos entonces que: 


pe Tiene SIDA No tiene SIDA 
Resultado | /B1] 1B2] Total 


Seropositivo /A1] 0,01998 0,02097 


Negativo /42] 0,9702 0,97908 
Total 0,999 1,00000 


PA, B,) = P(B)P(A,1B)=1[ |99](0,001] = 0,0099 
P(A,B,) = P(B.)P(A,1B,) = [0]92][0,999] = 0,01988 


Entonces: 

P(A,B,) = 0,001 - 0,00099 = 0,00001 

P(A.B,) = 0,999 - 0,01988 = 0,9702. 

La probabilidad de que para un seropositivo sea detectado es: 
P(B,|A,) = 0,0009/0,0209 = 0,0472. 


Ejercicios 
1. En una canasta hay caramelos de menta y fresa. Al tomar dos, tene- 
mos los eventos mf, fm,mm, ff. Diga cuál de ellos es el evento: 
A. No es de fresa. 
B. Hay uno de cada uno. 
C. Los dos son iguales. 


2. Construya el espacio muestral generado por los experimentos 
aleatorios: 


1]. Se seleccionan al azar dos pscleniás de un psicólogo, de una lista 
donde 3 son esquizofrénicos (e) y 2 obsesivos compulsivos (0). 


2] Nacen tres niños en un hospital y se evalúa el sexo de ellos. 
a) Si no interesa el orden. 
b) Si interesa el orden. 

3] El día del mes de febrero en que ocurre un choque de autos. 


4] Se seleccionan en forma aleatoria un grupo de tres estudiantes 
de una clase y se califica su conocimiento de estadística en sufi- 
ciente e insuficiente. 


3. Hay ratones en un laboratorio, hembras y machos, y se selecciona- 
rán dos al azar para asignarles a dos experimentos. Los posibles 
resultados son hh, hm,mh,mm. Construya los eventos: 


a) Ninguno es macho. 
b) Hay uno de cada sexo. 
c) Hay al menos una hembra. 


4. Determine el espacio muestral del ex »erimento aleatorio: Lanzo al 
aire 3 dados. 


61 


5. La propaganda de un resorte turístico va a ser lanzada y los empre- 
sarios involucrados desean establecer en los slogan valores de una 
probabilidad de obtener lo anunciado. Varios valores son fijados como 
atractivos y se deben asociar a los slogan. Establezca qué valores 
de la probabilidad deben unirse a estos: 


Slogan:: 

s1. El mejor servicio ... 

s2. Las molestias ambientales... 
s3. Obtener una compañía agradable... 
s5. Estará aburrido... 

s6. Conexiones telefónicas... 
s7. Seguridad para sus bienes... 
Probabilidades 

p1. 0,1 

p2. 0,99 

p3. -0,4 

p4. 0,01 

p5. 1,5 

p7. 99,9 


6. Se lanzan dos dados al aire y se suman sus caras. Determine el 
espacio muestral. 


7. Sea un suceso A = la, b,cy tal que AUB = ([a,b,c,dy y AMB = [b,c). 
Determine B. 


8. Un político analiza los resultados de una encuesta y valora algunas 
frases hechas que deben dar la idea que se reflejan en esta. Diga 
cómo debe usarlas: 


Frases: 
al. Es un hecho que aparece en una de cuatro ocasiones... 
b1. Casi siempre ocurre que... 

c1. En general esto ocurré... 

d1. Raramente ha pasado!... 

el. No podemos afirmar que vaa ocurrir... 


Frecuencias en la muestra: 


.a2.0 


8. 


9. 


b2. 0,50 
c2. 0,99 
d2. 1,00 
e3. -0,1 
f2. 2,9 
g. 0,25 


Halle la probabilidad de que al lanzar una moneda tres veces salgan 
2 caras. 


En un lote de 120 reproductoras de CD hay 50 en perfecto estado, 
30 que deben ser reparados y 40 que no pueden ir al mercado. Halle 
la probabilidad de los sucesos siguientes. 


A = Al seleccionar uno aleatoriamente este debe ser reparado. 
B = Debe ser reparado o no puede ser enviado al mercado. ' 
C = Está en buen estado o debe ser reparado. 

D = El comprador devuelve el equipo. 


10. Al golpear un balón para limpiar el campo un futbolista le envía a 


11. 


otro colega A con una probabilidad de 0,5 y otro B con una proba- 
bilidad de 0,7. Si A y B están en una posición desde la que pueden 
llegar al balón con una probabilidad de 0,3, cuál es la probabili- 
dad de que limpie el campo enviando el balón a uno de ellos. 


Los médicos de un hospital son en un 35 % menores de 40, en un 
50 % entre 40 y 55, y el resto son más viejos. ¿Cuál es la probabi- 
lidad de que sean mayores de 407? 


12. En un país obtienen subvenciones especiales las mujeres solteras 


de menos de 20 años con hijos y los mayores de 65 sin hijos. De 
las estadísticas oficiales se obtiene que los por cientos en esas 
categorías son 1,78 y 0,94. ¿Cuál es la probabilidad de: 


A = al seleccionar aleatoriamente ina persona esta recibe este 
tipo de subvención; 


B = al seleccionar aleatoriamente una persona con este tipo de 
subvención esta tenga entre 30 y 4 ) años? 
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13. En una serie de experimentos se obtuvo que en 40 pruebas 12 
pacientes mejoraron con el tratamiento, 30 mejoraron o subieron 
de peso y en 6 mejoraron y subieron de peso. ¿Cuál es la probabi- 
lidad de que un paciente aumente de peso? 


14. Un jugador lanza un dado en 3 000 ocasiones y obtiene los resulta- 
dos siguientes: 


Halle la probabilidad de los sucesos siguientes: 


A = Sale un número par al lanzar el dado. 

B = Sale el 1 o el 2 al lanzar el dado. 

C = Sale un número par y primo. 

D = La suma es menor que 3 al lanzar dos dados. 
E = Ambos números. son divisibles entre 3. 


15. Se observan las compras que llevan a cabo 15 clientes selecciona- 
dos al azar independientemente. Los resultados fueron: 


Número de clientes 


Producto 


Jabón 
Chocolate 


Halle la probabilidad de: 


a) Compra aceite. 
b) Compra chocolate. 
c) No compra jabón. 


16. Un análisis de los clientes del ejemplo anterior arrojó que los pa- 
trones de compra fueron: 


[Aceite y 
chocolate 


Halle: 

a) P(aceite o jabón). 

b) P(no chocolate). 

c) P(jabón y chocolate). 


17. En un estante hay 10 libros de historia, 5 de ficción y 5 dicciona- 
rios. Se seleccionará uno al azar. Halle la probabilidad de que 
este sea de historia o ficción. Si seleccionaran 2 libros sin reem- 
plazo, diga cuáles: 


P(uno es de historia y el otro de ficción) y P(los dos son dicciona- 
¿MOS). 
18. Un suavizador de pelo es evaluado en personas, con pelo seco y 


graso, y se miden si este dio el resultado esperado: obtener un 
pelo sedoso y sin caspa. Los resultados están en la tabla siguiente: 


Resultados del suavizador. 


Resultado esperado No dio el resultado 
(R) esperado (N) 


Tipo de pelo 


JU seco 9 


Graso (G) 360 270 


Halle la probabilidad de los eventos siguientes: 
a) P(R) 

b) P(R y G). 

c) P(G). 

d) P(S dado R). 

e) P(S y A). 

f) P(R dado G) 


19. El 10 % de los profesores de una facultad universitaria publican 
trabajos en revistas de reconocido r vel. Se hace un análisis de la 
productividad de estos y para ello < 2 seleccionan de 12 de ellos. 
¿Cuál es la probabilidad de que al rr enos uno de ellos cumpla con 
esta condición? Calcule la probabili lad de que más de 5 la tengan 
y compruebe si realmente la tienen 
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20. Los enfermos acuden a un especialista. Un médico diagnostica 
como posible enfermo de SIDA, a partir de un examen físico con 
una frecuencia de 0,7. Una prueba costosa es aplicada y esta cla- 
sifica el analizado con las frecuencias dadas en el gráfico SIDA. 


a) Halle la probabilidad de que sea positivo (+) . 


b) Diga qué es más probable: “A = es + dado que fue diagnostica- 
do como +” o “B = es diagnosticado no + dado que no fue 
diagnosticado +”. 


21. Se debe evaluar si se hace una reparación a un motor o se compra 
uno nuevo. En un 38 % de los casos, los resultados del análisis son 
adecuados e indican que este requiere de la reparación. El motor 
funcionará perfectamente si se hace la reparación en un 85 % de 
las veces y, si no se hace, en un 30 %. 


Halle la probabilidad de: 
a) El motor funciona. 
b) El análisis es adecuado y el motor funciona. 


c) Halle la probabilidad de que el análisis fue adecuado dado que 
el motor funciona. : 


Haga una tabla con las probabilidades envueltas. 


22. El dueño de un establecimiento sabe que los clientes pagan sus ' 
cuentas utilizando diversas normas y mide sus frecuencias en-el 
último semestre obteniendo la tabla de formas de pagos. 


Formas de pago de los clientes. : 

por ciento 

Si considera aleatoria la llegada de los clientes, halle las probabi- 
lidades de: j 

A 


B 
C = usa cheque y tarjeta.f 


usa tarjeta o cheque. 


no usa efectivo sino pheque. 


23. Un experto beisbolero dice que la probabilidad de que un bateador 
batee un hit después de h po cometido un error es de 0,8 y de 


| y 
yes 


que después del hit se cometa un error es 0,6. Utilizando estas 
probabilidades halle las probabilidades de: + 


a) Se cometen dos errores seguidos y después se da un hit. 
b) Se cometen dos errores seguidos y a estos le siguen dos hits. 
c) Se suceden un hit, un error y un hit, 


24. ¿Cuál es la probabilidad de que al lanzar al aire dos dados la suma 
sea 3 Ó 4? 


25. Un editor analiza el descriptor fijado por Zentralblatt como 92 en 3 
revistas. Los resultados en los últimos 5 volúmenes es: 


Economía Investigación Programación Teoría de 
Matemática Operacional. Matemática juegos 


Total 


¿Cuál es la probabilidad de que al seleccionar aleatoriamente un 
artículo de la base de datos esta satistaga? 


- A =Es de Investigación Operacional o de Programación Matemática. 
B=EsAodeB. 
C = Es de Investigación Operacional, dado que es de A. 


26. Una fábrica produce chips, de los que no son aptos para la pro- 
ducción un 10 %. Si los defectos son independientes de chip a 
chip, ¿cuál es la probabilidad de que al seleccionar al azar 20, 
para forma un lote el comprador no rechace ninguno? 


27. Un profesor sabe que el 60 % de los alumnos tienen problemas 
con los conceptos matemáticos, un 15 % con el uso correcto del 
idioma y el 25 con el uso de la computación. El 45 % de los que 
tienen problemas con la matemática suspenden y el 70 % de los 
que usan mal el español también, mientras que el 40 % de los 
que los tienen con la computació + tienen el mismo resultado. 
¿Cuál es la probabilidad de: 


a) Si un alumno no termina 1er añe fue por la matemática. 
b) Un alumno no termina 1er año! 
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28. Al hacer un cruce de dos razas de reses, H y C, se obtiene en los 
partos características que hacen que el ternero se parezca a una 
de las dos más que a la otra. Se analizarán 2 partos. Los resultados 
posibles son HH, HC, CH, CC. Halle la probabilidad de: 

a) Los dos son HH. 
b) Uno al menos es C. 


c) El segundo es C:si el primero tue H. 


29. Diga qué variables son aleatorias y cuales continuas en los fenó- 
menos siguientes: 


a) Número de pacientes en una consulta. 
b) Milimetros cúbicos de lluvia caídos en un semestre. 
c) Tiempo que demora el contacto con internet. 


) 
d) Canciones nominadas para un premio por los jóvenes de una 
escuela. 


e) El conteo de glóbulos rojos en un análisis de sangre. 


30. Al final de un concurso quedan tres filmes y estos serán evaluados 
por dos jueces. Si X es la calificación total que obtiene un film, de- 
termine los posibles valores que puede recibir una película. 


31. Si en el concurso anterior había 7 filmes nominados en la catego- 
ría drama y hay 3 premios, 4 son dirigidos por nativos del país y el 
resto por extranjeros. Si la selección se hace aleatoriamente, deter- 
mine la distribución de probabilidad del número de directores ex- 
tranjeros premiados. 


32. En un torneo de fútbol se han efectuado 381 juegos, estos se 
encuentran distribuidos como sigue: 


Utilice esta tabla para determinar la distribución de probabilidad 
del número de goles en laltemporada y halle la media y la varianza 
de esta variable aleatoria. ! 


33. Una tabla con las frecuent E con que consultan la bibliografía de 
una biblioteca es analizada para hacer estudios probabilísticos. 
Se desea establecer la Sol eS con que las mujeres consultan 


libros de ciencias y la de que al seleccionar un lector sea hombre, 
dado que lee una novela. Se tiene la tabla siguiente: 


Consultas de libros en una biblioteca. 


vrujres:— MOSES ARCE CC 


34. Un futbolista anota gol en 1 de cada 3 penalties. Halle la probabili- 
dad de que no anote en 4 penalties. ¿Puede esperar que lo haga 
en alrededor de una ocasión? 


35. En una bolsa con 10 naranjas hay 4 con la corteza dañada. El 
comprador selecciona 4 al azar, ¿cuál es la distribución de probabi- 
lidad del número de naranjas con este defecto? 


36. Un agente turístico trae un grupo de viajeros. Si ellos deciden ir a la 
playa, el costo del paquete será de 600 USD por persona y si se quedan 
en la ciudad, de 1 500. El evalúa varias distribuciones de probabilidad: 


1. P(playa) = P(ciudaa). 
2. P(playa) = 2P(ciudad). 
3. P(playa) = 0,9 

4. P(ciudad) = 0,7 


Halle lo que este espera ganar y recomiéndele la distribución más 
favorable. 


37. El uso del servicio de ventas de un equipo electrónico por Internet 
de una compañía tiene pedidos con los por cientos dados en la 
tabla siguiente: 


% del mercado 60,10 A£ 0,15 0,25 0,35 


a) ¿Cuál es el valor esperado de las ve ntas y cuál es el de la varianza? * 


b) ¿Cuál es la pro vablidas de que un pedido.sea de más de 75 
equipos? 
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38. Una campaña publicitaria es hecha y se lanza un nuevo cosmético 
al mercado. Se hace una encuesta con los resultados siguientes: 


Respuesta Frecuencia 


¿Cuál es la probabilidad de obtener un cambio para el nuevo cos- 
mético? ¿Considera que la mayor parte de los compradores lo eva- 
lúan bien? 


39. Se supone que los trabajadores de un taller hacen trabajos extra 

los fines de semana con una frecuencia del 50 %. Se toma una 

- muestra de 20 trabajadores y se desea dar respuesta a las inquie- 
tudes siguientes: 


a) ¿Cuál es la probabilidad de que ninguno haga trabajo extra? 
b) ¿Cuántos espera lo hagan? 

40. El promotor de una campaña de protección ambiental dice que el 
90 % de los jóvenes apoyan sus puntos de vista. Se toma una 
muestra de 30 jóvenes de una Universidad donde el 60 % le apo- 


yaban. Halle la probabilidad de que ese suceso ocurra si los crite- 
rios del promotor son válidos. 


41. La probabilidad de que un televidente haga suya las recomenda- 
ciones de un anuncio sobre perfumería es de 0,6. Se toma una 
muestra de 30 televidentes en forma aleatoria e independiente. 
Halle la probabilidad de que: 


a) Más de la mitad las hacen suya. 
b) Esto ocurre con 5 o nfás. 
c) Ninguno lo hace. 


42. En el ejercicio anterior, he cuántos espera acepten el mensaje 
en una muestra de 500 y 'uál es el error típico. 


i 


¡e 


43. 


44. 


45. 


46. 


47. 


48. 


Seleccionamos una muestra de 10 estudiantes de un aula y sabe- 
mos que la probabilidad de aprobar es de 0,7. 


Determine la distribución del número de estudiantes aprobados. 


El aspirante al título de los pesos superpesados triunfa en el primer 
intento en un 75 % de las veces. Si se considera que cada intento 
es independiente de los demás, halle la probabilidad de que en USOS 
intentos no obtenga la faja. 


Un tirador acierta con una probabilidad de 0,9 al blanco. Asumien- 
do independencia entre los disparos, haremos un experimento en 
el que él hace 5 disparos. Halle la' probabilidad de que: 


a) Acierta en todos. 
b) No acierta ninguno. 


Un entomólogo estudia el comportamiento de la mosca lipsófaga. 
Las capturas de esta se hacen exitosamente, con una frecuencia 
relativa del 0,15. Este hace capturas cada día. ¿Cuántos días debe 
utilizar para capturar con una esperanza mayor que 2? 


Una prueba para detectar seropositivos es efectiva el 90 % de las 
veces. Se toma una muestra de 5 personas en forma independiente. 
Determine la distribución del total de seropositivos que detectaría 
en una muestra de 5 sospechosos. 


Asisten regularmente a clases 24 alumnos, de los cuales 4 traen 
regularmente sus computadoras portátiles. El profesor va a hacer 
un ejercio donde el uso de un logicial es importante. Selecciona 6 
para que monitoreen el desarrollo de la práctica. Determina la pro- 
babilidad de: 


* A = Ninguno tiene un desktop. 


49. 


B = Al menos uno trajo un desktop. 


Se sabe que el 20 % de los rollos de papel producidos por una 
fábrica son más frágiles de lo prescrito. Un comprador tomará una 
muestra de 4 rollos antes de comprar. Su estrategia es: 


1. Comprar si ninguno es defectuoso. 
2. Solicitar rebaja si uno es defectuc so. 


3. Fijar un precio de menos del 50 % del solicitado, si hay 2 con 
defectos. 


4. No comprar si hay más de dos c »fectuosos. 
Halle las probabilidades correspor Jientes. 


v 


50. 


51. 


52. 


53. 


54. 


DO. 


56. 


Las 40 parejas asistentes a un banquete presentan un ticket, el que 
le asigna un lugar en la mesa, aleatoriamente. ¿Cuál es la probabi- 
lidad de que en un grupo de 4 coincidan en la misma mesa de 12 
comensales? 


Un grupo de 5 jóvenes va a hacer un recorrido en bicicleta. Ellos 
compran 3 gomas de repuesto suponiendo que el 50 % de ellos 
requerirá de una. Halle la probabilidad de que: 


| a) Un joven necesite de la goma de repuesto y no.la obtenga. 


b) No alcancen las gomas compradas. 


Se seleccionan 5 trabajadores de una empresa con 2 120. Se hace 
una encuesta para indagar sobre el criterio que hay sobre la direc- 
ción. Si hay 80 contestatarios entre los trabajadores, ¿cuál es la 
probabilidad de que 2 de ellos sean entrevistados? ¿Cuántos espe- 
ra aparezcan en la muestra? 


La probabilidad de que dos aviones arriben al mismo tiempo a un 
aeropuerto es de 0,00005 y se sabe que arriban 10 000 por mes. 
¿Cuál es la probabilidad de que esto ocurra y cuál, de que a lo más 
dos lo hagan? 


Se valora la capacidad de un revisor para detectar errores de im- 
prenta. El volumen de una revista tiene 200 páginas y se distribu- 
yen 100 errores aleatoriamente en ellas. Determine la probabilidad 
de que: 


a) Una página tiene 5 errores. 
b) Una pagina tiene al menos 3 errores. 


La ocurrencia de interrupciones en el sistema de distribución de 
gas a domicilio ocurre con una probabilidad de 0,02. Se obser- 
van 500 días. Determine la distribución en forma explícita. 


Los displays producidos por la empresa STMAS tienen problemas 
con la definición de imágenes 3-D animadas, en 2 de cada 100 
unidades. La producción[es de 400 unidades por día. Halle la pro- 
babilidad de que si un cojmprador hace su selección de 8 displays 


aleatoriamente tenga 5 dbn problemas. 
SÍ. 


La incidencia de parasitit mo en una población rural es de 9 de 
cada 10. Si en un poblado may 5 000 habitantes. ¿Cuál es la proba- 
bilidad de que exactamen 5 estén parasitados? 
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Se analizarán 500 terremotos de intensidad mayor de 3,5 puntos en 
la escala de Richter en el siglo XX. El interés de los volcanólogos es 
establecer la ocurrencia simultánea de ellos en ciclos de 144 000 
segundos. Determine la probabilidad de que: 


a) Lo hagan en más de 1 ocasión. 
b) Entre 1 y 3. 
c) No más de 5. 


En una red de teléfonos celulares las llamadas se intercambian a 


razón de 300 por hora. Si tomamos una muestra aleatoria, halle las . 


- probabilidades de que: 
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62. 


63. 


a) Se intercambian no menos de 2 en un minuto. 
b) Se intercambian no menos de 1 en un minuto. 


Cc) No se intercambian en 10 minutos. 


El funcionamiento de una emisora de señales de radio se asocia a: 


fallas modelables por una Poisson, donde estas ocurren con una 
frecuencia de 1 cada 50 horas. Halle: 


a) P(X > 1) en 8 horas. 
b) P(X = 0) en 24 horas. 
c) ¿Cuántos espera trabajarán en una transmisión de 200 horas? 


La probabilidad de que el clonaje de un vegetal fósil de menos de 
100 años sea exitoso es de 0,001. Se tienen 2 000 muestras. Diga: 


a) ¿Qué distribución utilizará? 
b) Halle la probabilidad de que 3 experimentos sean exitosos. 
C) Más de 2 no son exitosos. 


Un distribuidor de mensajes los circula con un promedio de 24 
por hora. 


a) Halle la probabilidad de que en 5 minutos ninguno arribe. 
b) ¿Cuál es la de que arriben más d » 2 en un minuto? 


El 2 % de los intentos por violent r teléfonos de alcancía son 
exitosos. Halle la probabilidad de « ue en 200 intentos aleatorios 


no más de 5 sean exitosos. 
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65. 


66. 


67. 


68. 


69. 


Un jurado de 10 expertos evalúa un grupo de concursantes en un 
concurso de belleza. Si la calificación se considera aleatoria diga, 
cuál es la probabilidad de que la votación para una concursante 
sea (8,1,1) y cuál de que sea de acuerdo a la proporción 3:3:4. 


Al bar más popular del planeta XC23 de la Galaxia Unsher la con- 
currencia es de un 50 % de terrícolas, un 30 % de Megalonoides y 
un 20 % de otros Humanoides. Se hará un sorteo para dar un viaje 
de recreo en el crucero donde se desarrollará un programa 
promocional de un líquido desinhibidor. Dadas las reacciones de 
los distintos Humanoides, se desea saber la probabilidad de las 
distintas estructuras de los premiados. Determine las probabilida- 
des correspondientes si se darán tres premios. 


La distribución de la duración del repuesto de una impresora láser 
en una oficina sigue una distribución exponencial con esperanza 
de 180 días. Vamos a comprar uno y deseamos saber cuál es la 
probabilidad de que: 


a) Dure más de 360. 
b) Dure menos de 90. 


c) Si seleccionamos 3, ¿cuál es la probabilidad de que uno dure 
no más de 90, otro entre 90 y 360, y el otro más de 3607? 


Un especialista en informática asume que los usuarios hacen uso 
de los sistemas de Base de Datos existentes en la red con un pro- 
medio de 0,5 por hora en forma independiente. Se analizará un 
intervalo de dos horas para estudiar la variable “tiempo transcurri- 
do entre el acceso a los sistemas de Base de Datos”. Halle: 


a) P(X> 1) 

b) P(X < 5) 

c) P(X > 2) 

d) PIX> 10X< 1) 

En el ejercicio anterior se toma como distribución del tiempo de 
los fallos una exponencial f(x) = 0,001exp(0,001x). Halle: 

a) P(X > 100) 
b) P(X > 1 000) ; 
El tiempo de uso simul e del mismo canal de TV por cable 


sigue una distribución exi ¡onencial 0,5 exp(-x/2). Halle la probabi- 
lidad de que este esté ap 1,2 y 1,8. 


, 
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70. 


La fotocopiadora de una facultad trabaja sin interrupción por 
sobrecalentamiento, de acuerdo a una variable (por ciento de tiem- 


- po en días de ocupación) exponencial con parámetro 5,8. Halle la 


71. 


72. 


73. 


74, 


79. 


77. 


probabilidad de que lo haga durante más de una semana. 


Anuncios publicitarios sobre medicinas aparecen en un canal de 
TV de acuerdo con un proceso Poisson con media 50 por hora. Se 
observará una hora del día aleatoriamente. ¿Cuál es la probabili- 
dad de que pasen al menos 2? 


La distribución en semanas del tiempo con gánancias por encima 
de 50 puntos en el Dow Jones de las acciones dé una compañía, 
es una exponencial con media de.20,5. Halle la probabilidad de 
que se tengan ganancias de este tipo por más de 5 semanas. 


Un viajante puede usar dos rutas en su recorrido de ventas. En uno 
el tiempo es descrito por una N(27, 25) y por la otra N(30,4). ¿Cuál 
es la mejor si este desea estar menos de 34 días fuera de casa? 


Las acciones en un portafolio dan ganancias descritas por una 
distribución N(82, 144) en cuentas valoradas en USD. El banco : 
toma una muestra aleatoria de 64 portafolios. ¿Cuál es la probabi- ' 
lidad de que su ganancia promedio esté entre 80,8 y 83,2? 


El tiempo en horas por día de consulta en el sitio WEB de una 
revista electrónica es modelado por una N(2,16). Halle la probabi- 
lidad de que este sea un valor entre 1 y 4 al seleccionar uno 
aleatoriamente. : 


. El crecimiento de un organismo multicelular es descrito por el logaritmo 


de la variable X obtenida por aparato electrónico. Si log(X) sigue una 
N(1,4) halle la probabilidad de que X esté en el intervalo [0,5 2]. 


El promedio al bate de un bateador designado en una liga juvenil 
de pelota sigue una distribución N(300, 115). Seleccionaremos 


- aleatoriamente 5 de ellos. Halle la probabilidad de que: 
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a) La media obtenida sea mayor que 333. 
b) La media está entre 310 y 350. 
c) Supera los 400. 


Un baloncetista hace canastas de 3 : untos en 2 de cada 10 inten- 
tos. Si este hiciese 50 intentos en u . certamen, halle la probabili- 
dad de que enceste la 8. Utilice los m delos de la Binomial, Poisson 
y Normal, y compare los resultado: . : 
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80. 


81. 


82. 


83. 


84. 


El por ciento de la vida útil de una impresora en una oficina res- 
pecto a lo que afirma el fabricante sigue una N(60,4). Determine la 
probabilidad de que: 


a) Esté entre 55 y 63. 
b) Es mayor que 63. 


La concentración de larvas de mosquitos es medida por un coefi- 
ciente. En una pecera esta es una variable normal con media 200 y 
desviación típica 5. Se dice que es controlable el vector, si este está 
entre 190 y 200, preocupante cuando supera los 208 puntos y que 
no haya problemas cuando no supera los 50. Halle las probabilida- 
des correspondientes a estos sucesos. 


El uso de un instrumento de control de la radiactividad en una 
central átomo eléctrica da mediciones con una media de 9 y una 
varianza de 0,0004. Se harán mediciones aleatorias en una mues- 
tra de tamaño 100 dentro del área que controla. Responda las 
preguntas siguientes: 


a) ¿Podemos aceptar la normalidad de las variables? 

b) ¿Podemos aceptar la normalidad de la media? 

c) ¿Cuál es la probabilidad de que el valor esté por debajo de 8? 
e) ¿Cuál es la probabilidad de que esté entre 8,99 y 9,02? 


El por ciento de jóvenes que gustan del Jazz-Juction sigue una 
distribución N(15, 89). ¿Cuál es la probabilidad de encontrar entre 
5,5 % y un 12,8 % en una muestra de 200? 


El índice de promiscuidad sexual entre los aquejados de enfermeda- 
des venéreas controlados por un hospital especializado, es modelable 
por una distribución normal con media 506 y varianza 6 561. El 
epidemiólogo está interesado en hallar las probabilidades de que al 
sacar una muestra de 10 pacientes el índice promedio es menor de 
574. Además, desea fijar los cuantiles de orden 50, 75 y 95. 


La ganancia en el peso le cerdos que se alimentan con una dieta 
rica en soya a los 6 mekes de vida es una N(50,64). Dé una res- 
puesta a:: 


a) Si un cerdo gana 54 Ky ¿cuál es el percentil más cercano a él? 


b) Si se dice que el proceso es lento cuando la probabilidad de 
observar un cierto valdr X es menor que 0,02 halle el percentil 
correspondiente. 
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c) Si se dice que el progreso es rápido cuando la probabilidad de 
observar un cierto valor X es mayor que 0,85 halle el percentil 
correspondiente. 


La calificación en una prueba de matemática con intenciones de 
clasificar a los estudiantes de Comunicación Social y Publicidad, 
es descrita por una N(80,160). El profesor va a hacer una predic- 
ción del comportamiento de la próxima prueba y desea hallar la 
probabilidad de que la media de una muestra de 10 estudiantes. 


a) Está en el intervalo [73, 89]. 
b) Es menor que 75. 
Cc) Es mayor que 86. 


Los psicólogos elfos miden la inteligencia de los hobbits. Esta es 
considerada una variable con distribución N(15,26). Se visita un 
poblado de ellos cercano a la capital de los elfos y se toman 13 
adultos aleatoriamente. Se desea conocer la probabilidad de que 
la media de éllos esté entre 13 y 17. Si el coeficiente de los elfos es 
8,2 veces mayor que la de los hobbits, diga cuál es P(104< X <136) 
y la equivalencia entre la unidad de medición usada para hobbits 
con respecto a la de los humanos es Y = 4X + 60 obtenga los 


- percentiles de estos últimos para los órdenes 75 y 95. ¿Cuál es el 
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percentil de un hobbit y el de un elfo con inteligencia igual a u? 


Si el más famoso y hábil hobbit Mr. Bilbo poseía un coeficiente de 
25, ¿qué percentil representa? 


El tiempo dedicado a la atención semanal de los ancianos en fami- 
lias con fuerte influencia matriarcal sigue una distribución N(10,4). 
Halle la probabilidad de los eventos siguientes: 


a) Es mayor que 20. 
b) Es menor que 5. 
c) Está entre 8 y 12. 


Los peces larvífolos eliminan las larvas Je mosquitos Aedes Aegipty 
en el 30 % de los estanques de una : ierta dimensión máxima. Se 
tomará una muestra de 1 000 estang les. Se evalúa la zona como 
“bajo control de vectores” cuando | ay menos de 280 por mil y 
como en alerta si es mayor de 316 ¿Cuál es la probabilidad de 
que en esto ocurra? y 
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91. 


92. 


93. 


En 2 de cada 10 casos un jugador acierta en la ruleta de una 
ocasión. El croupier toma aleatoriamente 300 jugadores y quiere 
establecer cuán probable es que entre 49 y 71 sean ganadores. 


Si en el ejercicio anterior la ganancia de un 'ganador' es una varia- 
ble N(100, 19 200), determine la probabilidad de que como prome- 
dio ellos se lleven: 


a) Menos de $107. 

b) Más de $110. 

c) Entre $95 y $106. 

d) Entre $88 y $100. 

e) Entre $88 y $100 o más de $110. 


Un analista de precios utiliza comúnmente como modelo de sus erro- 
res de predicción una N(1,36). Si él toma una muestra de 10 produc- 
tos básicos, halle la probabilidad de que el error promedio sea: 


a) Mayor que cero. 
b) Entre 0,2 y 1,8. 
La probabilidad de que el clonaje de un mamífero superior sea 


. exitoso se produce en 1 de cada 3 intentos. Se realizan 5 600 


94. 


95. 


96. 


experimentos aleatorios. Halle la probabilidad de que sean entre 
1180 y 1 220 los éxitos. 


El éxito de una clonación de bananos tiene una probabilidad de 
0,5. Se toma una muestra aleatoria e independiente de 100 expe- 
rimentos y se desea hallar la probabilidad de que: , 


a) Hay 500 éxitos. 
b) Hay entre 40 y 60, ambos incluso. 


El por ciento de goles marcados por un equipo de fútbol en penalties 
es considerado como una variable normal con media 50 y varianza 10. 
Halle las saetas ql 

1 


a) Está entre 32,5 y 67,4 
b) Es mayor que 65. 
c) Es menor de 25. 


Si en el ejercicio anterioj 
penalties fuera de 6 a 10, h 


¡la proporción de marcar goles para los 
pe la probabilidad de que en 100 intentos: 
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100. 
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a) Marque más de 100. 


b) Marquen entre 80 y 105. 


En una población de 1 000 huéspedes alojados en un hotel 200 
son extranjeros. Se realizará una encuesta tomando aleatoriamente 
80 huéspedes. ¿Cuál es la proba aca! de que halla en ella más 
de 20 extranjeros? 


El arribo de lectores a una biblioteca es considerada una variable 
con distribución Poisson con media 12. Utilice la aproximación nor- 
mal para calcular P(8 <X< 20 ) y compárela con el resultado exacto. 


Los meteoritos que pululan entre el Astro Xl y Beta A18 tienen un 
diámetro descrito por una N(1,5 0,09) cm. Al viajar entre estos 
planetas asumiremos que el encuentro con uno de ellos es un 
evento aleatorio. Demuestre la probabilidad de que: 


a) Su diámetro está entre 1 y 2 cm. 
b) Su diámetro es menor que 0,8. 
Dé respuesta a las inquietudes siguientes del astronauta: 


a) Si la nave tendrá problemas si tropieza con 200 meteoritos y la 
media está entre 0,9 y 1,1; ¿cuál es la probabilidad de que 
esto ocurra? 


b) Si el peso de un meteorito es de 5 diámetro?, ¿cuál es el peso 
promedio esperado? 


T'lin tratará de escapar en uno de los dragones de su horda 
de los guardias de Narsh. Estos logran atravesar las colinas 
protegidas por la diosa Ois en el tiempo requerido para burlarla 
sus perseguidores con frecuencias del 0,4; 0,1; 0,03 y 0,2. Es- 
tos tienen su kurf'st en paz con con Visek tras una ceremonia 
de sacrificios con una frecuencia de 0,01; 0,04; 0,06 y 0,1 res- 
pectivamente. Los deseos de Visek priman sobre los de Ois, 
por tanto, se desea establecer ¿cuál es la probabilidad de que 
logre su objetivo y use el tercer dragón? 


Una empresa A produce computad 1ras que fallan antes de las 
250 horas de trabajo en un 1 % de >s equipos, y otra B con un 
5 %. Una oferta es realizada para ad ¿uirir un lote usando un 90 % 
de equipos de la empresa A y 10 de aB. ¿Cuál es la probabilidad 
de que al probar una computadora seleccionada aleatoriamente 
esta sea de la empresa A, si esta ti ne defectos? 
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103. En un volumen la revista !O publicó el 70 % de los trabajos en espa- 
ñol y el resto en inglés. Otra que cubre los mismos temas lo hizo en 

* una proporción 40-60 %. Tenemos 10 ejemplares de los cuales 9 son 
de la segunda revista. Halle la probabilidad de que al seleccionar 
aleatoriamente un artículo este sea de lO si está escrito en español. 


104. Un test psicológico detecta líderes grupales, si lo son con una fre- 
cuencia del 0,9 y define como no líderes a quienes no tienen esta 
potencialidad en un 0,99. Se sabe que hay un 1 % de ellos en un 
grupo estudiantil. Halle la probablidad de que un individuo selec- 
cionado aleatoriamente sea un líder si la prueba lo califica como tal. 


Respuesta a ejercicios seleccionados 


2.115 = ((6,8), (e,0), (0,01), 
2]a.S = [(vvwv), (h,v,v), (h,h,v), (A,h,d)y, 


b. S = [(Uvv), (h,v,v), (v,h,V), (vv, A), (h,h,v), (h,v,h), (v,h,h), 
(h,h,Ayy, 


3] S = (1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 
20, 21, 22, 23, 24, 25, 26, 27, 28) 


-4]S= ((s,s,s), (S,6,5), (1,5), (5,0) 
7. B = (b,c,d). 
9. P(A) = 3/12, P(B) = 7/12, P(C) = 8/12, P(D) = P(C). 
10. PÍAUB) = P(A) + P(B) - P(ANB) = 0,5 + 0,7 — 0,3 = 0,9. 


12. P(A) = 0,0178 + 0,0094 = 0,0272; B = 6 por tanto esa probabilidad 
es cero. 


13. Como este es un evento suma, al despejar obtenemos que esta es 0,6. 
14. P(A) = P120 406) =P(2) + P(4) + P(6) = 175/300 
PB) =P) +P)=114 
P(C) = P(2) = 25/300 | 


(1 y 2) + PQ y 1) = 2[P(19P(2)] = 0,028 


P(D) = P£(1,2) o (2,1)) =1 
P(E) = P£(3,3) o (3,6) o ($,3) o (6,6)) = 2[P(3)P(6)] + P(3)P(3) + 


P(6)P(6) = 0,145.' 
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15. a. 4/15, b.7/15, c. 13/15. 

16. a. 9/15, b. 12/15, c.0. 

17. 15/20, 5/19, 1/19. 

18. a.0,6 b.0,7 c.0,2 d.0,33 f.0,43. 


22. P(A) = 0,79. 
23. a. 0,048 b. 0,0512 c. 0,09. 
24. 5/36. 


26 Como son independientes, la probabilidad de que los 20 sean Ae 
tos es 0,9% = 0,1216. 


27. a. 0,5684. 

36. 1050 USD, 3. 540 + 150 = 690. 

37. 0,60.' 

38. 0,49. Si es 0,85 la probabilidad. 

39. a) 0,358 b) 1 

43. Es una B(10, 0,7). 

45. a) 0,59. 

- 47. Tenemos las variables Bernoulli 

X, = 1 si el paciente ¡ es calificado como seropositivo. 
X, = 0 si el paciente no es calificado así. 
Como 

E(X)=0 


el número de pacientes clasificados como seropositivos sigue una - 
distribución Binomial B(5, 0,9) y: * 


f(x) = C5.0,9 0,1% 
O sea, que la Tabla para la B(5, 0,9) es: 
Valores de la probabilidad para una / '(5, 0,9). | 
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48. Como es una Hipergeométrica, f(0) = 0,288 y P[X > 0] = 1 —f[0]. 
49. 0,4096 0,4096 0,1536 0,0272. 

51. a) 0,5* [C*, + C*, + C%, + (8/4)C?, + (3/5) C*, ] = 0,91. 

52. Es Hipergeométrica, f(2) = 0,164 y m = 3,3333. 

53. Es Poisson, 0,0758 y 0,9856. 


55. Es una Poisson y: 


56. 0,093. 
57. Si se seleccionan con reemplazo es una Binomial y la probabilidad 


es de 0,5905 y si no 0,5892. 
61. a) La Poisson b) 0,18, c) 0,323. 
62. 0,135 y 0,008. 
63. 0,785. 
64. 0,00152 y 0,07113. 
65. Utilizamos una Multinomial y obtenemos: 


66. 0,393 0,135 y 0,472. 
67. a) 0,6065 b) 0,8647 c) 
68. 0,6065 0,0067. 

71. 0,1882. 


113679 d) 0,999. 
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73. 


74, 
75. 
76. 
79. 
80. 
83. 
85. 
88. 
90. 
91. 
92. 
93. 
94, 


95. 
96. 
97. 


Como es 0,912 con la primera y 0,978 con la segunda, prefiere 
esta última. 


0,5762. 

0,3830. 

0,242. 

0,6678, 0,2266. 

0,4772, 0,0548 yO. 

Los cuantiles son 506, 561,08 y 638,84. 
0,9477, 0,1056 y 0,0668. 

0,0001, 0,0062, 0,6862. 

0,903. 

a) 0,8092 b) 0,1056 c) 0,0394 d) 0,4332 e) 0,5388. 
a) 0,9938 b) 0,9544 

0,5246. 


a) Como la distribución es una 8(100 0,5) y n es grande P(X = 50) 
= P(X< 50) —- P(X < 49) = 0(0,1) - P(-0,1) = 0,08. 


b) 0,964. 
0,9198, 0,0668 y 0,0062. 
Usando la aproximación Normal a la B(100, 6/10) son 0,023 y 0,034. 


En este caso la distribución es Hipergeométrica con p = 0,2, por 
lo que la media es 16 y la varianza 11,79. Esta se aproxima por 
una B(80, 0,2) y está por la correspondiente normal. Entonces 
obtenemos con la aproximación, que la probabilidad del evento 


deseado es 0,095. 


98. 
100. 
101. 
102. 
103. 
104. 


0,896 y 0,8989. 
b) 16,875. 
0,39. 

0,022. 

0,163. 

0,0826. 


Capítulo 3 
Estimación 


3.1. Generalidades 


La necesidad de analizar una masa de datos fue vista en el capítulo 1. 
Las variables son medidas y se obtienen valores de ellas, la informa- 
ción que ellos brindan deben ser condensada y se utilizan algunas 
medidas para caracterizarla. El interés por la posición lleva al uso de 
medidas de posición, y si es importante estudiar la variabilidad se utili- 
zan las de dispersión. En particular nos interesan las medias, las 
varianzas y, por supuesto, la desviación típica. 


En el capítulo 2 analizamos la distribución teórica de probabilidad. Las 
variables aleatorias son generadas por una distribución de probabili- 
dad y las medidas caracterizan el comportamiento de la variable 
aleatoria. Estas medidas son parámetros como la media teórica o es- 
peranza matemática de la variable, su varianza y su desviación típica. 
Si estas son conocidas, podemos calcular las probabilidades necesa- 
rias. En la práctica, estas se desconocen y se tienen realizaciones de la 
variable aleatoria, lo que nos lleva nuevamente al tener datos. El des- 
conocimiento de lós parámetros es aliviado por el uso de los 
estadígrafos, los que ahora se llaman estimadores, dada su función. 


Definición 3.1. (Estimador Puntual). 


Sea X una variable aleatoria y 8 un parámetro desconocido de su distri- 
bución de probabilidad. Un estimador puntual de € es un estadígrato 
(una función de los resultados de la mues ra que no depende de valo- 
res desconocidos) que se utiliza como si stitutivo del parámetro. 


Por otra parte, nos puede interesar estab! :cer un intervalo en el cual es 
verosímil que € pertenezca. Esta verosin litud se expresa en términos 
probabilísticos. El intervalo ofrece ademé 3, una idea de la precisión del 
estimado que utilizamos. 
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Definición 3.2. (Estimador por intervalos). 


Sea X una variable aleatoria y € un parámetro desconocido de su distribución . 
de probabilidad. Un estimador por intervalo de confianza de 8 es un intervalo 
]Ja,b[ tal que P(6e [a,b]) es un valor prefijado donde a y b son estadigrafos. 


Estas dos definiciones serán usadas para resolver probigmas asocia- 
dos a cualquier parámetro. 


En este-capítulo nos dedicaremos a ver estos problemas para los 
parámetros u, o? y o fundamentalmente. El caso de las proporciones 
no es más que un caso particular de la esperanza y. 


3.2. Estimación Puntual 


. A partir de la Definición 3.1. las medidas definidas en el capitulo 1 pueden 
usarse como estimadores. Indudablemente es necesario establecer las 
propiedades de estos con vistas a establecer cuáles son más adecuados 
o establecer los riesgos asociados al uso del que seleccionemos. 


En particular se utiliza el error cuadrático medio del estimador. 
Definición 3.3. (Error Cuadrático Medio de un estimador). 
La precisión de un estimador es medida por: 


ECM[a(x,....x.)] = Eld(x,....x,) — 0]? = Eld(x,,...x,) — Eld(X,....x,)1% + 
[E[ox......x.] - 8]? 


donde: 

d(x,,....X,): es un estimador de € evaluado en la muestra (X,....X,). 
El primer término es la conocida definición de varianza: 
E[d(x,,....X,) — Eld(X,,....x,)112 = V[a(X,,....X,)] 

Y el segundo es el cuadrado del sesgo: 

S[alx,,....X,)] = [E[a(x;,....x,] — 8] 


Es recomendable que el estimador tenga un pequeño valor del error 
cuadrático medio. 


Para valorar la conveniencia'le usar un estimador analizamos sus pro- 
piedades. Las propiedades ihás importantes son: 

Propiedades de los estimadiores 
1. Insesgadez. 


Un estimador d(x,.....x,) de 9 sp dice que es insesgado si Elalx,.....x)] = 8. 
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2. Consistencia. 


Un estimador a(x,....x_) de 6 se dice que es consistente si A(X,,...X ) =0 
cuando n es suficientemente grande (n—>09).. 

3. Eficiencia. 
Un estimador d(x,,....x ) de 6 se dice que es eficiente si ECM[a(x,,....x,)] 
decrece cuando n crece (ECMl[a(x,... .X)]>0 cuando n—>). 
Note que si un estimador es insesgado, 
ECM[al(x,,...x,)] = V[al(x,.....x,)] 


Por ello es muy popular el uso de estimadores insesgados. En parti- 
cular, la media muestral 
_ PX 


X= i=l 
n 


es un estimador que posee todas esas propiedades. 
Ejemplo 3.13. Una población estadística está dada por X, = 2, X,= 3, 
X, ="1 por lo que u = 2. Si tomamos una muestras de tamaño n = 2 sin 
reemplazo, el espacio muestral está compuesto por las muestras: 
s,= (2,3), s,= (2,1), s,= (3,1). 
La media es una variable aleatoria con posibles valores 2,55; 1,5 y 2. 
Dada la definición de esperanza: 


ES 3 
o 


que coincide con el del valor de la media teórica como establece el 
hecho de ser insesgado. 


Entonces queda claro que si un éstimador « es insesgado sabemos que 

si repetimos el proceso de muestreo y promediamos sobre todas las 
posibles muestras, obtendremos el valor del parámetro que queremos 
estimar. No podemos decir nada respecto a la muestra observada, pero 
sí del comportamiento del procedimiento utilizado. 


- Como un estimador es consistente cuando n- >0e (n = 3 en este caso) XL. 
El error asociado a este estimador es: 


si las variables son independientes. 
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Note que también es eficiente, pues: 
E 2 : 
l X !- 0 
n 


Entonces, el uso de la media muestral es una buena solución para 
solventar el desconocimiento de |1, pues este es un estimador insesgado, 
eficiente y consistente. 


sin => 0 


Para estimar la varianza, una solución similar es obtenida al usar: 


Z 


Xx 


Ejemplo 3.2. En el Ejemplo 3.1 las varianzas estimadas son: s,?=x, s?,= 1, 
y s,?= 2 y que la varianza teórica es 0?= 2/3. Al aplicar la definición de 
esperanza se tiene que: 


E(s)=Y 5% P(s Jo E1t0_2 
j=l 3 3 


Esta también es consistente y eficiente. Note que la estimación de una 


probabilidad P(A) es realizada al tomar una muestra y calcular la fre- 
cuencia con que esta aparece. Por tanto, 


donde: 


eS] 


1 si ocurre A 
0 si ocurre 


estima P(A). Por ello la distfibución de frecuencias calculada al obte- 
ner una muestra aleatoria nps permite estimar la distribución de pro- 
babilidad. : 


Ejemplo 3.3. Se toma una ¡nuestra de 100 músicos y se evalúa el 
número de óperas en que hiin ejecutado su instrumento. Los resul- 
tados fueron: 
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TABLA 3.1. 
Ejecución en óperas del instrumento de plantilla 


vo OE 
A as 


Se desea estimar la probabilidad del evento: 


A = haber ejecutado más de 3 veces una ópera. 
Por tanto: 

p(A) = 0,59 

Tenemos dos diseños básicos de muestreo: 
Definición 3.4. (Diseño Muestral). 


El diseño simple aleatorio es aquel en que cada unidad de muestreo 
tiene la misma probabilidad de ser seleccionada en cada ocasión. 
Hay dos esquemas básicos: el Muestreo simple aleatorio con reem- 
plazo y el Muestreo simple aleatorio sin reemplazo. 


Las variables son independientes si la selección de las unidades utiliza 
reemplazo. 


- Ejemplo 3.4. Tenemos una población formada por A,,... A. , 
donde: 
X(A,) = 2, X(4,) = 1, X(4,) = 0, X(4,) = X(4,) = 3 


Al seleccionar una muestra de tamaño 3 con reemplazo de la lista de 
números aleatorios: 


57/3590145670157 
están en la muestra A,, A, y A,. Por tanto, al estimar la media esta es: 
7 3+0+3 
AAA 
3 
la muestra sin reemplazo sería A,, A, y A, '': 


=2 


=  34+0+2 
AAA AR 
3 


=2.5 


Ambas tienen la misma esperanza. 


Una diferencia importante es que las varianzas son diferentes. 
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Definición 3.5. (Varianza de la media muestral al.usar muestreo sim- 
ple aleatorio). 


La estimación de la media en el diseño simple aleatorio es realizada al 
utilizar X. Este es un estimador insesgado, eficiente y consistente de y. 
Para el muestreo simple aleatorio con reemplazo el error es: 


ES 


es su estimador insesgado. 


Si se usa muestreo simple aleatorio sin reemplazo se tiene que: 


En AS _ 
€ mo” _ N=n E 
(N—Dn Nn 


(x)- (N—=n)S? 
Nn 


son el error y su estimador respectivamente. 


Como se puede ver en general, el uso del reemplazo se asocia a una 
varianza mayor, aunque garantiza la independencia, lo que es muy im- 
portante. 


Ejemplo 3.5. Usando los datos de los Ejemplos 3.1 y 3.3 determinamos 
la varianza del estimador de y. 


Tenemos que o? = 2/3, por tanto, para el caso en que el muestreo es 
con reemplazo: 


(Nil) o? _-6-2/3 


v00= NA 7 a 


=0,1667 


es el resultado si no se reemplaza. 
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3.3. Estimación por intervalos 


3.3.1. Intervalos de Confianza para la media de una 
variable normal con varianza conocida 


Recordando que la media de una variable X con distribución nor- 


mal sigue una distribución normal con media y y varianza o?/n te- 
nemos que: 


7er e, 09 


por tanto, podemos despejar 1 y obtenemos que: 


hue liz, oks, 0 Jato 


y podemos determinar el intervalo de confianza para la media y si la 
varianza 0%es conocida. 


En general 1 — a = zes un valor cercano a uno y es conocido como 
nivel de confianza, confiabilidad. En muchas ocasiones se habla de la 
confiabilidad como de un por ciento: 1007 %. a es denominado “coefi- 
ciente de confianza”. : 


Ejemplo 3.6. Se sabe que el coeficiente de agresividad de un Dobermann 
es una variable normal con varianza 25. Se quiere estimar un intervalo 
de confianza para estos perros y se toma una muestra aleatoria inde- 
pendiente de 9. La prueba arrojó una media muestral de 187,5. Halle el 
intervalo de confianza para x = 0,95. 

Solución 

Como 1 = 0,95'tenemos que a = 0,05 y el f ercentil a usar es sz, 075 = 1,96. 


Entonces nuestra estimación es: 
IC[u] = ]187,5 — 1,96 - 5/3. 187,5 + 1,96 : 5/3 [=]184,23 190,77[. 
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3.3.2. Intervalos de Confianza para la media 
de una variable normal con varianza desconocida 


Cuando la varianza no es conocida su estimación es hecha usando S?, 
Del capítulo 2 sabemos que: 


a a 
P =t1-—,n-1D,((1-—>,n-1D |=1-0 
( qe ), 3 | 


X-H 
5 


Por tanto, usando un procedimiento similar al utilizado para el caso de 
la varianza conocida, obtenemos que un intervalo de confianza para u 
con varianza desconocida es obtenible del hecho de que: 


fue Proa ao Jaro 
] n 


vn 22 Cn 


Ejemplo 3.7. Un comerciante toma una muestra aleatoria independien- 
te de 16 establecimientos y anota el precio del arroz envasado por la 
casa. Este fue de 1 385 el kilo con una varianza de 0,25. Este desea 
hallar un intervalo de confianza para el precio esperado en el mercado 
con una confiabilidad del 90 %. Hágalo. 


Solución 


Al desconocer la desviación típica, esta fue estimada en 0,5. Como 
T(15 0,95) = tenemos que la semiamplitud del intervalo confidencial es: 


t(0,95 15)0,5/4 = 1,75 - 0,125 = 0,21875 
por lo que: 
IC(u) = ]1,385-0,21875, 1,385 + 0,21875[=]1,16625 1,60375[ 


Note que si el tamaño de la muestra es suficientemente grande el 
percentil (1 — a/2, n- 1) = 4]... 
Ejemplo 3.8. Se hace una ejncuesta sobre la preferencia de la serie 
televisiva “Los Dinosaurios” gntre los niños de 7 y 12 años. 400 niños 
son seleccionados y dan unalicalificación a esta en una escala del 1 al 
10. El promedio obtenido fue He 8,64 y la desviación fue 1,14. Halle el 
intervalo de confianza para la media con a = 0,01. 
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Solución 
Como T(399 0,995) =Z,... = 2,58 


0,995 


IC(u) =]8,64-2,58 - (1,14/20) 8,64 + 2,58 - (1,14/20) [=]8,49294 8,78706[ 


3.3.3. Intervalos de Confianza para la media - 
de una variable no normal 


En el caso en que la variable no tiene una distribución normal, el * 
Teorema Central del Límite garantiza la normalidad de la media arít- 
mética. Por tanto, para valores suficientemente grandes de la mues- 
tra podemos usar el mismo procedimiento que en 3.3.1, si conoce- 
mos la varianza. 


Si no conocemos la varianza, el mismo teorema garantiza que la media 
sea una variable normal. 


Al estimar la varianza y usar: 


Estamos ante el mismo problema que nos llevó a usar la distribución 
T-Student en 3.3.2. como la muestra es grande nuevamente el percentil 
a utilizar es sustituible por el de la normal estándar. 


Ejemplo 3.9. El estudio de la edad promedio de los documentos exis- 
tentes en los archivos de una iglesia construida en 1678 es desarro- 
llado. Se toma una muestra de 3 600 partidas de bautismo de los 
viejos archivos y se obtuvo que estas tenían una edad promedio de 
130,65 años con una desviación de 12,89. Halle el intervalo de con- 
- fianza para la esperanza de la edad de un documento seleccionado 
al azar. Use'a. = 0,05. 


Solución 
Es claro que: 


IC(Ww) = ] 130,65 - 1,96 - (12,89/60) 150,65 + 1,96 - (12,89/60 [=] ' 
130,22893 131,07107[ ] 
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3.3.4. Intervalos de Confianza para la proporción 


Los intervalos de confianza para la proporción son obtenidos al utilizar 
el hecho de que: . 


( si ocurre Á 
X, = 


0 sino 


es una variable Bernoulli cuyo parámetro P es la proporción (P(4)). Ya 
vimos que: 


n 


Ex 


j=1 


_ Númerode veces en que ocurre A _ 


n n 
es un estimador insesgado de P y que: 


vip) = E PEDO 
n 


: n 
es estimado por: 


pU=p) 
n 
si se utiliza muestreo aleatorio con reemplazo y: 


(N—n)pQ- p) 
n(N-1) 
si no se hace reemplazo. 


Dada la convergencia de las variable Binomial a la normal si el tamaño 
de la muestra (n) es suficientemente grande (n > 30). Los correspon- 
dientes intervalos de confianza están dados por: 


E POP pz , [PA p) 
o n 7 n 
(N—-n)pd- p) 
Y (V—-Dn 


respectivamente. 


Ejemplo 3.10. Una firma alemana da la categoría de Netzpiloten a aque- 
llos que hacen un viaje exitoso a través de una serie de sitios fijados 
por esta en Internet. Se toma una muestra de 100 jóvenes universita- 
rios y se obtuvo que el 92,5 % de ellos recibieron esa categoría. Halle el 
intervalo de confianza para la probabilidad de que un n joven universita- 
rio sea Netzpiloten a = 0,05. 


Solución 
Como p = 0,925, Z, ¿,, = 1,96 y la estimación del error es obtenida al 
computar 
POP) - 91089375 — 000069375 
n 100 
y: 


PP 0.026 
WE 


el intervalo de confianza es: 
IC[P] = ]O0,9265 - 1,96 - 0,026[=]0,873 0,977[ 


3.3.5. Intervalos de Confianza para la varianza 
y la desviación típica de una variable normal 


La distribución de vs” es una Chi-cuadrado con v grados de libertad, 
por lo que: o? 


o (n-1)5? 104 
rr5)s PE ei) 


Al despejar o? obtenemos: 


2 
(n—-DS <o? < 


A PTAS 


Entonces: 
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Es interesante notar que si n > 30: 


A +/2v yo 


Por ello podemos usar esta aproximación en el cálculo de los interva- 
los de confianza. 


Ejemplo 3.11. Halle intervalos confidenciales del 95 % de confianza 
para la varianza del ejemplo 3.7 y la desviación del ejemplo 3.8. 


Solución 
Para el ejemplo 3.7 tenemos que S?= 0,25 y n = 16. Tenemos que 
Y? (15, 0,975) = 27,5 y x* (15, 0,025) = 6,26. Por tanto: 


15-0,25 15 -0,25 
27,5 * 6,26 


IC(o?) - - J0,1364,  0,5990/ 
Para el ejemplo 3.8: 


ns ana? 2 2 
MS a MS RENE pa CINON19 
era 2 j] fra E ] 1 (399 0975) 1 (899, 0,025) 


y como x?*(399, 0,975) = 124,3  y*(399, 0,025) = 74,2 
- IC(6*) = ]0,0042 0,070[ 


IC(c) = 10,065 0,26[ 
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3.4. Tamaño de la muestra 


Para determinar el tamaño de la muestra lo ideal es que el interesado fije 
un valor de la precisión. Esta puede ser fijada asociada a la noción dada 
por la definición de intervalo de confianza o por un criterio porcentual. 


En el primer caso, tenemos que fijar un margen de error e y una proba- 
bilidad pequeña a de que se supere este al estimar u. Es decir: 


nia 20» 
e=Z y (3) 
=g 


despejamos n y obtenemos que: 


Como: 


Z 


hs E si es muestreo con reemplazo. 


Z NY  sies muestreo sin reemplazo. 


Note que un caso muy particular es el de las proporciones en que 
a? = P (t — P). Como esta obtiene su valor máximo cuando P = 0,5 
podemos computar también la cota máxima de n para un problema 
determinado. 


Ejemplo 3.12. Los viejos dicen que los act 1ales gnomos llevan la barba 
muy corta. En una aldea con 430 gnomo: se desea tomar una muestra 
para valorar el largo promedio de su barba. Se asume la normalidad 
de la variable asociada y se dice que st: varianza en tiempos anterio- 
res era de 85 5987 y que esto sí no ha cambiado. ¿Cuál es el tamaño 
de muestra necesario para que la diferencia entre la estimación y el valor 
real de la media no supere los 1 899 cm con una confianza del 95 %? 
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Como nos han dicho si seleccionarán con reemplazo o no, es por esto 
que calculamos n para ambos casos y obtenemos que en el caso con reem- 


plazo: 
_ (196)'85,5987 _ 


(1,899) 


y: (1,96) 85,5987 
(1,899) a 
jsol (1,96) 85,5987 

430 (1,899) 


en el sin reemplazo. 


3.5. Tabla resumen de los intervalos confidenciales 


Caso Notas Intervalo de Confianza 


U con O 
nacida X Normal, 4.= cap 


uy con y X Normal, 
desconocida | 2 =T(n—1,1- 042) 


H con O E 
conocida y | X no Normal A =Z,_, X- AA qe 
n grande 
conocida is q, pee e EL 
j = - a +43 
de no ormal, 1 E hn 


X Bernoulli, A =Z,_., A 
_ de vn 


(n-1)5?* (n-198? 
» A" 


=p 1 Lay, | eE feas 
A“ = m-— E 0/2) e de 
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Ejercicios 
| 
1. Se hace un experimento con 6 ancianos seleccionados aleatoria- 
mente entre los pacientes de geriatría de un hospital. Estos son 
sometidos a hipnosis y desarrollan ejercicios de fuerza que decían 
les eran imposiblee de realizar, a pesar de que esta afirmación no 
tenía una razón somática. Las calificaciones obtenidas fueron: 


36,1 34,9 35,8 35,3 37,2 y 36,1. Estime h y o. 


2. Una encuesta es desarrollada entre 100 abonados a un Festival Ci- 
nematográfico y se les inquiere sobre su edad, el gasto que hace 
mensualmente en actividades culturales, las veces-mes que visita 

- Cines, y el por ciento de veces que es satisfecho con la programa- 
ción. Los resultados obtenidos como salida de un paquete estadís- 
tico aparece en la Tabla 3.2, “Estudio de abonados” 


TABLA 3.2. 
Estadísticas del estudio de abonados 


Sample » A 
E "MP Mean Median Stdev Stdmean Mín Máx Qi  Q2 


Ñize 


MY oo | 158 | 105 [039 | 009 [000] 300 | 03001 


Que puede decir respecto a: 


A) La representatividad de estos resultados sobre lo que ocurre en 
la ciudad donde fue seleccionada. 


B) En qué casos considera adecuada la media para caracterizar el 
comportamiento de la variable en la población muestreada. 


3. Al estudiar el comportamiento de mo ¡os en cautiverio se hace un 
experimento sobre su aprendizaje de nuevos hábitos de alimenta- 
ción. Una muestra de 10 es seleccio!.ada y se obtiene que logran 
acceder y manipular los mecanismos fijados en sus celdas a la hora 
en que estos están disponibles al cat o del tiempo, en días, siguien- 
tes: 3,88 3,92 3,97 3,95 3,98 3,92 4,09 4,02 4,03 4,06. . 


A) Estime la media, ¿es un valor que les caracteriza adecuadamente la media? | 
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4. Los camioneros de una firma cobran salarios proporcionales al cum- 
" plimiento de un reglamento que cotiza el cumplimiento de las entre- 
gas y el estado del vehículo. Se toma una muestra de ellos y se 
obtiene que estos obtienen en ese mes: 1230,50 1567,3 2300,75 
890,50 560,00 235,20. 


A) Estime la media y la varianza. 


B) ¿Considera que la media caracteriza adecuadamente la posi- 
ción de cualquier camionero? 


5. Un arquitecto evalúa los precios dados por diversos suministrado- 
res de hormigón armado con las condiciones de dureza que él plan- 
tea. Las cotizaciones, que él considera una muestra aleatoria, fue- 
ron: 8,62 8,39 8,96 8,51 8,56 8,51 8,56 8,82 8,54. Haga una 
estimación adecuada de la cotización promedio del mercado y si 
cree que esta da una medida confiable. : 


6. Se selecciona una muestra de 80 estudiantes de una facultad y se 
obtiene que 20 de ellos emplean 2 horas por semana a su recrea- 
ción y el resto 3. Halle la media y la varianza de la variable “tiempo 
semanal dedicado a la recreación”. 


7. Un entomólogo descubre una nueva especie de mariposas la que 
mide la envergadura de sus alas en los 15 ejemplares que ha captu- 
rado. El colega le dice que puede asumir que la muestra es aleatoria 
y que, por tanto, puede usar la media obtenida de 10,439 cm como 
un valor representativo de la especie. Sin embargo, al calcular la 
varianza observa que esta es de 97 381 y se pregunta si la afirma- 
ción anterior es válida. Diga qué Ud. piensa. 


8. Se toma una muestra de 5 elfos y se obtiene que su coeficiente de 
inteligencia (C) promedio fue de 234,78. Si este es una variable nor- 
mal con una varianza de 659,46, halle un intervalo de confianza para 
el promedio teórico de su Cl! con a = 0,10. 


9. Un agrónomo quiere estudiar el rendimiento de una nueva especie 
de maíz y selecciona 1 500 mazorcas cuyos granos son contados y 
se mide cuántos de ellog son de color morado. Se obtuvo que el 
"promedio de granos por fhazorca fue de 342,6 y la desviación fue de 
25,2. Fueron morados 1 497. 


A) Halle el intervalo de confianza para la esperanza del número de 
granos en una mazorca. 


B) Halle el intervalo de confianza para el por ciento esperado de 
granos morados en una mazorca. 
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10. Se hace una encuesta sobre la corruptibilidad de directivos de alto 


11. 


nivel en una empresa transnacional. Se toma una muestra de 25 
empleados indagándose sobre su valoración de qué por ciento de 
los jetes lo son. Aceptando la normalidad de la variable correspon- 
diente y que la desviación típica es de 12,59, halle un intervalo con 
una confianza del 95 % para el por ciento as si la media 
obtenida fue de 53,71 %. 


Se analiza la existencia de una conserva de pescado. Una mues- 
tra de 200 latas es tomada al azar del inventario existente en el 
almacén y se analiza el tiempo que falta para su vencimiento. El 
tiempo promedio en días fue de 35,25. Si se acepta la normali- 
dad y que o = 10 y se utiliza a = 0,01, halle el intervalo de confian- 
za para el tiempo promedio que falta para eliminar las conservas. 


12. La propaganda de una cerveza se va a afirmar en el índice de 


preferencia de esta como bebida refrescante. Se toma una mues- 
tra de 36 obreros de la construcción y se obtuvo que el índice 
promedio fue 72,64. Si este es una variable normal con desvia- 
ción 10 halle el intervalo de 99 % de contianza que ofertará a los 
publicitarios. 


13.Un banco analiza los gastos que hacen los clientes con cuentas 


mayores que 500 000 $ usando tarjetas de crédito. Consideran- 
do que esos siguen una normal con varianza 1,5 millones de- 


- sean hallar un intervalo de confianza para el gasto promedio 


14. 


15. 


basado en estas tarjetas. Toman una de 250 muestra y la media 
fue de 10 425,80.$. Use a = 0,05. 


Una muestra de 25 ratones fueron clonados y su tiempo de vida 
fue medido obteniendo que el promedio fue de 2,6 años. Si el tiem- 
po de vida es una variable normal con varianza de 0,25 ¿puede 
decirse que el promedio de los clonados vivirán entre 2 y 3 años 
con una probabilidad mayor que el 0,9? 


Un biólogo analiza el efecto de la ¡r1estación con un ácaro en 
cítricos. Se sabe que el por ciento ulel área de la corteza de las 
frutas afectadas es una variable normal con varianza 34,82. En 


- Una muestra aleatoria de 20 naranjas infestadas, estime el por 


ciento promedio y determine un intervalo de confianza para u 
con a. = 0,05 (ver Tabla 3.3). 
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16. 


17. 


18. 


19. 


: TABLA 3.3. : 
Por ciento de afectación por un ácaro de la corteza de naranjas 


91] seso 97 


os] aa] 60] 79] 97] 


Una empresa productora de Mother Boards hace un muestreo de 
estas y les somete una política de Burn-in y detectaron fallas bajo 
altas cargas de voltaje, al cabo de las horas siguientes de trabajo 
ininterrumpido: 5 699; 3 982; 2 301; 898; 849; 3160; 5178; 2983 
y 2 901. Halle el intervalo de confianza del 90 % si se asume la nor- 
malidad y que o = 100. ¿Qué tamaño de muestra recomienda usen 
para que garanticen una amplitud del intervalo de garantía a los 
compradores no mayor de 10 horas? 


El tiempo de viaje en el recorrido de los camiones distribuidores de 
mercancías de una empresa comercial es considerado normal con 
o = 12,73. Se hace un estudio y se seleccionan aleatoriamente 
camiones y se obtuvo que hacían el recorrido en el número de ho- 
ras siguientes: 13,84; 3,65; 7,81; 6,71; 4,58; 8,45; 3,78; 3,67 y 4,78. 


A) Estime el tiempo promedio que se usa en un recorrido. 
B) Halle el intervalo para un 90 % de confianza para Lu. 


Un lanzador de jabalina hace lanzamientos que siguen una distribu- 
ción normal con varianza 5,47 metros según su entrenador. Este hace 
lanzamientos durante un mes y la comisión olímpica toma una mues- 
tra aleatoria de 15 de ellos y obtiene una media de 68,91 metros. 


A) Halle el intervalo de confianza para la distancia que se espera 
tengan sus lanzamientos. 


B) Considera posible afirmar que este puede promediar 70 me- 
tros. 


lidad de que la semikmplitud del intervalo sea menor que 0,5 


C) Determine un a somben muestra que garantice que la probabi- 
metros sea de 0,95. 


* 


Una vaca produce leche con un contenido de grasa que se considera 
normal con una desviación del 5,6 %. Se toma una muestra de 6 litros 
de leche y se obtiene que el por ciento de grasa es del 10,46. Halle 
intervalo de confianza para el por ciento promedio de su producción. 
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20. 


21. 


22. 


23. 


24. 


25. 


Si en el ejercicio 1 se acepta que o = 4,5 halle el intervalo de 
confianza del 95 % y determine un tamaño de muestra adecuado 
para |x-ul=2 

La eficiencia de un automóvil se mide por los kilómetros que reco- 
rre por litro. Se toma una muestra de 100, salidos de una línea de 
producción en una jornada. La eficiencia media de ellos fue de 
34,78 km/ litro y una desviación típica de 6,32. 


1. A) ¿Cuál es su población objetivo y cuál la muestreada? 
2. B) Halle el intervalo de confianza para el promedio de la población. 


3. C) Proponga un tamaño de muestra para obtener una diferen- 
cia entre la estimación de la media y la teórica de no más de 
5 metros. : 


Use a = 0,05. 


Una muestra de 3 600 enfermos es seleccionada aleatoriamente y 
se obtiene que el nivel de afectación en una prueba de habilidad 
psicomotora obtuvo un puntaje promedio de 91,25 puntos de 150 
posibles. No se acepta la normalidad de la variable. La varianza 
obtenida fue de 2 456,19. Halle el intervalo de confianza old el 
puntaje esperado con a = 0,01. 


Una fábrica realiza pruebas con un nuevo método que ¿deba ser no 
contaminante. Se seleccionan aleatoriamente 900 muestras de las 
emisiones de desechos sólidos y se obtiene un índice promedio de 
contaminantes de 23,19 con una varianza de 212,14. Halle un inter- 
valo de confianza del 95 % para el promedio poblacional. Determi- 
ne cuántas muestras deben ser tomadas para garantizar un error 
de no más de 0,5. 

Un analista muestrea la población de muestras tomadas en un 
laboratorio al hacer una inspección de calidad. Este obtuvo las 
diferencias siguientes con el conteo de hemoglobina reportado: 
0,17; -1,34; 5,67; 8,12; -4,30; 5,61; 0,78; 4,32; 2,11; 1,67; 0,56 y -1,65. 
Si se acepta la normalidad, halle L 1 intervalo de confianza y un 
tamaño de muestra para |*-u|<C,1cona =0,01. 

Una muestra de 75 turistas es seleccionada y se obtuvo que la 
calificación promedio dada a la oferta de coctelería fue de 0,152. Si 
se acepta la normalidad de esta con desviación típica de 0,01, halle 
un intervalo confidencial del 95 % para la calificación esperada. 
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- 26. Tras hacer una propaganda sobre una rebaja de precios por fin 


27. 


28. 


29. 


30. 


de temporada, una tienda venderá ropa “prét-a-porter” de marcas 
exclusivas francesas. Se toma una muestra de clientes habituales 
y se indaga cuál sería su inversión si se les abriese una línea de 
créditos por un equivalente a 10 000 Euros. Los resultados fue- 
ron: 5 400, 5 179, 4 460, 4 500, 5 090, 3 700, 690, 5 398 y 3 799. 


A) Halle un intervalo de confianza para la venta media esperada. 
B) Hágalo para las ventas totales entre las 350 clientas habituales. 
Use a = 0,10. 


El consumo de arroz quiere ser estimado y para ello se selecciona 
una muestra de 600 familias en toda una región. La media obtenida 
fue de 0,56 kg por persona a la semana con una desviación de 0,1. 
¿Cuánto espera Ud. que consuma en esa región las 10 500 perso- 
nas que habitan en ella, en una semana? Use a = 0,05. 


Los bebés nacidos en un hospital son muestreados en un mes y se 
obtuvo que el peso promedio de ellos al nacer fue de 3,41 kg y el 
largo de 57,38 cm. Si las varianzas correspondientes en la muestra 
de 50 bebés seleccionados fueron de 0,09 y 7,39, halle intervalos 
de confianza para ambas medidas con a = 0,10. 


Los recorridos efectuados en giras turísticas se cumplieron en un 
90 % de los casos, en una muestra aleatoria de 82 seleccionadas 
de los registros de una región. 


A) Halle un intervalo de confianza para el porcentaje de giras que 


cumplimentaron con el plan. 


B) Halle un intervalo de confianza para el número de giras que 
espera cumplimentarán con el plan, si se efectúan 500. 


Use a = 0,10. 


Se compra un nuevo equipo para medir la dureza de las barras de 
acero, producidas por una empresa metalúrgica. Este cumple con 
los requerimientos establecidos por los compradores en el extran- 
jero. Para hacer la oferta, de dureza se toma una muestra de 900 
barras seleccionadas delfun lote por exportar, y se obtuvo que el 
promedio de las diferenchas entre la dureza media solicitada y la 
obtenida en las barras fue de -1,2638 con una desviación de 0,037. 


A) ¿Qué intervalo ofertará Ud. al comprador como garantía al 99 %? 


B) ¿Cuántas barras deberá muestrear para ofertar con a. = 0,05 un 
intervalo con una amplitud de no más de 0,001? 
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31. Sesenta estudiantes disparan 10 veces con un fusil de guerra a un blanco 
inmóvil. Estos se consideran como una muestra aleatoria de los jóvenes 
de la municipalidad. El número de blancos obtenidos es (ver Tabla 3.4): 


TABLA 3.4. 
Resultados de 10 tiros con fusil 


No. de blancos Lol1l2[3l41s[6[7|8[9]|10] 
No. de jóvenes HEEE 


A) Estime el promedio de blancos y un intervalo de confianza del 95 % 
para este. 


B) ¿Podemos inferir con estos resultados sobre el municipio? 


32. Se estudia si los televidentes están contentos con la programación 
de un canal de televisión. Se toma una muestra de 100 televidentes 
y de ellos el 73,6 % lo están. 


A) Halle el intervalo con un 99 % de confiabilidad para el por ciento 
de “satisfechos”. 


B) ¿Considera que puede argúirse que el 85 % está de acuerdo? 
Use a = 0,05. 


33. La aplicación de un fertilizante que utiliza K,O es analizada en plan- 
taciones de caña de azúcar. Los rendimientos obtenidos a partir 
del muestreo de 20 campos determinó una producción por caba- 
llería de 864 055,29 kg con una desviación de 12 342,85. 


Halle el intervalo de confianza para el rendimiento esperado con a = 
0,10. 


34. La probabilidad de éxito editorial de una novela romántica escrita 
por una mujer no conocida por el público se estudia. Para ello, se 
toma una muestra de 200 lectoras de un club de lectoras de una 
ciudad a las que se les pregunta si comprarían una novela escrita 
por una autora novel. 92 de ellas dijeron que sí después de leer la 
reseña que se pondría en la prensa como publicidad. 


A) Halle el intervalo de confianza pa a la probabilidad de que una 

- mujer de esa ciudad acepte la novela después de leer la reseña. 
Use a = 0,05. 

B) Si se espera, que esa obra sea un éxito, si se vendieran más de 10 200 

- libros en una ciudad con 50 000 mujeres, qué diría Ud. de esta obra. 


C) Sugiera un n tal que |p— P|<0,05. 
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35. 


Un cantante es contratado por una orquesta de salsa consideran- 
do- que su carisma hará elevar la venta de un nuevo CD que graban 
con su participación. Este actúa en un baile donde compraron bo- 
leto 1 562 personas. Se hace una encuesta en una muestra de 234 
asistentes y se obtuvo que el 24,6 % de los entrevistados le consi- 
deran como carismático. El director quiere hallar un intervalo de 

confianza para el número de ciudadanos que: 


- A) Le consideran carismático. 


36. 


37. 


38. 


39. 


40. 


B) Comprarán el nuevo CD donde este aparece. 


El promotor del grupo de salsa del ejercicio anterior repite la expe- 
riencia tomando una muestra en una escuela musical y obtiene 
que 12 delos 60 jóvenes entrevistados gustan de este cantante y 5 


compran: el disco. Dé respuesta a las interrogantes del ejercicio 


anterior y sugiera cuántas personas se deben muestrear para ga- 
rantizar un error no mayor del 10 % en la escuela musical. 


El Dr. Frankenstein sometió a prueba a su creación para probar su 
capacidad física e intelectual. Realizó 100 pruebas. Obtuvo un “ín- 
dice de resistencia” de 126,8 con una desviación de 87,5 y uno de 
“identificación” de 23,51 con desviación de 1,27. Halle los interva- 
los de confianza para la esperanza de ambos índices y diga cuál de 
ellos Ud. considera más confiable. Use a. = 0,10. 


La política de mantenimiento ecológico que presenta un grupo a 
una comunidad científica obtiene que es apoyada por el 87,9 % de 
los muestreados, en una muestra de 60 afiliados. Halle intervalo de 
confianza para el por ciento de votos que esperan obtener en la 
votación de su proyecto. Use a = 0,01. 


Los opositores de la teoría establecida por un parapsicólogo de 
que los habitantes de un pueblo montañés valoran que es mágica 
la ceiba por los criterios dados por diversos brujos y viejos, hacen 
un cuestionario cuya calificación es evaluada en una muestra de 
100 habitantes del pueblo. El promedio observado fue de 5,68 pun- 


tos con una varianza de $ ,23. 
A) Halle el intervalo de cdnfianza con a = 0,05 para el promedio. 


B) Opina que el establecido por el parapsicólogo es aceptable si el 
valor del promedio teórico bajo la teoría de este es de 5,757? 


Halle los intervalos de confianza para las variables estudiadas en el 
ejercicio 2. 
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41. El tiempo que demora en curarse un paciente sometido a un tratamiento 
de choque contra una neumonía es medido en 18 pacientes seleccio- 
nados aleatoriamente. El tiempo promedio fue de 3,45 días con una 
desviación de 1,70. Halle el intervalo de confianza con a = 0,05. 


42. Un Comité de Bioética hace un estudio entre científicos para iden- : 
tificar el nivel de reflexión de ellos sobre los problemas éticos pre- 
sentes con el conocimiento del genoma humano. Se tomó una 
muestra entre los envueltos en este problema en 9 países y se ob- 
tuvieron los resultados siguientes (ver Tabla 3.5). 


TABLA 3.5. 
Calificación del conocimiento de los problemas éticos envueltos 
en el desarrollo del genoma humano. Resultados de las encuestas 


Desviación 
de la Media 


; Tamaño E Eres 
País Media Desviación 
¿ de la muestra 


e 
MEN MOTA TA ER 20 
ERE. AAA A e 
8 |3s | ss | 25 |. | 
EE A A 


A) Complete la tabla. 
B) Diga en qué casos puede hacer intervalos de confianza. 


C) Construya los intervalos de confianza del 90 %, en los casos 
que sea factible y diga qué considera de los países que ha podi- 
do analizar. 


43. Una muestra es tomada entre mujeres con hábitos de promiscui- 
dad. Se evalúa el por ciento de contactos sexuales que realizaron 
con protección en un semestre. Se seleccionan 6 al azar y se ob- 
tiene que estos fueron: 10,12; 6,32; 7,39; 11,87, 5,67 y 11,37. 


Estime la media y halle el intervalo de confianza con a = 0,01. 
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44; 


45., 


46. 


47. 


48. 


En el ejercicio 5: se considera que el comportamiento de las cotiza- 
ciones es modelable por una distribución normal. Halle el intervalo 
de confianza para la media con a = 0,01. 


Se estudia el mantenimiento de las tradiciones folklóricas en Guyana 
Francesa. Para ello se entrevistan a 400 jóvenes, entre 18 y 30 años, 
sobre sus conocimientos sobre el rito funerario tradicional de los 


 cimarrones, conocido como awasa. Para ello, se hizo un análisis de 


su manejo de los elementos danzarios, musicales y de contenido 
de las canciones supuestamente más populares. Los resultados 
determinaron una calificación promedio de 54,71 puntos de 100 
posibles con una varianza de 76,20. Halle el intervalo de confianza 
para la calificación esperada con a = 0,10. 


Cinco flautistas son seleccionados, al azar, entre los recién pro- 
movidos en las escuelas de arte. Se mide el tiempo que pueden 
mantenerse sin respirar mientras ejecutan en la flauta de Pan. Los 
resultados fueron: 6,37; 6,32; 6,33; 6,36 y 6,37. Si se acepta la 
normalidad halle el intervalo de confianza del 90 % para el tiempo. 
esperado, del tiempo en que puede producir música continua- 
mente la nueva generación de flautistas. 


El director de un equipo de pelota toma una muestra de 20 juegos 
celebrados frente a un lanzador y valora los ingresos promedio . 
obtenidos en los stadiums correspondientes por la venta gorras 
del equipo visitador. Las ventas promedio fueron de 45 325 USD. 
Este quiere conocer un intervalo donde se deben encontrar las ven- 
tas de gorras de ese equipo considerando la variable como normal 
y que la desviación computada fue de 950, 26 USD. 


A) Hállelo. 
B) ¿Cree que puede esperar que venderá unos 50 000 USD? 


Se somete a la consideración de una muestra de 400 estudiantes 
de Ciencias Sociales la interpretación del haikai: 


Como pulpo atrapado en la vasija 
pla ars con el instante 


contemplando la luna de verano 


del poeta japonés del siglo xvi! Bashó. Dan una interpretación so- 
bre lo efímero de la vida humana 27 de ellos. 


Halle el intervalo de confianza para los que considera Ud. que lo 
harían entre los 5 670 estudiantes de esa rama. Use a = 0,10. 
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49. 


50 


51 


52. 


53. 


54. 


El tiempo que está una máquina herramienta trabajando sin rotura 
es medido en una muestra de 9 fábricas. Se obtuvo que el promedio 
fue de 21,45 meses con una desviación de 11,32. Halle el intervalo de 
confianza para el tiempo sin rotura de estas máquinas. Use a, = 0,01. 


. Una muestra de 100 practicantes de budismo es tomada y se mide 


el número de pulsaciones por minuto que estos tienen al estar en 
estado de meditación media. Estos promediaron 67,5 con una 
varianza de 8,6. Determine un intervalo de confianza con a= 0,01. ' 


. Se someten a estudio usando técnicas de carbono radioactivo la 


edad de una muestra de 53 tonalmatis aztecas pintados en papel 
de amate. Estas promediaron una edad de 563,35 años con una 
desviación de 1,23 siglos. 


Halle un intervalo de confianza para la edad de la población 
muestreada con a = 0,10. 


Una empresa hace una investigación sobre la identificación de los 
empleados con los intereses de ella. Una encuesta se lleva a cabo 
y un psicólogo entrevista a 16 empleados. El cuestionario tenía una 
calificación máxima de 100 puntos y el promedio fue de 62,50 y la 
desviación fue 21,87. 


A) Halle el intervalo de confianza para la esperanza de esta califica- 
ción. 

B) ¿Pueden considerar los jefes que la calificación esperada puede 
ser considerada menor que 66,5 con una probabilidad de más 
del 0,99? Use au = 0,01. 


El director de un teatro valora contratar un espectáculo y entrevista a 25 
de los abonados y obtiene que ellos planean invertir al asistir un prome- 
dio de 85,00 $. Aceptando la normalidad y tras computar la varianza 
que fue de 24,56 $, halle un intervalo con una confianza del 90 %. 


El aprendizaje de los nueve navarasa de la danza clásica hindú es 
analizada al tomar una muestra de 9, entre las más consideradas 
bailarinas de bharata natyam en la región de Orissa, al sur de Ben- 
gala. Ellas reportan el tiempo que les llevó tener la maestría de unir 


- gesto y palabra en un código armónico. Al considerar el tiempo 


necesario como una variable normal y usado sus reportes, que lle- 
varon a fijar un promedio de 12,74 años con una desviación de 
2,57; determine un intervalo de confianza para el tiempo que se 
espera deba utilizar una bailarina novel. Use a = 0,10. 
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55. 


56. 


57. 


58. 


59. 


Se estudia el contenido de material reciclable en la basura que se 
produce en un vecindario de clase media alta. En una muestra de 
200 contenedores residenciales se obtuvo que era de 0,82 kg con 
una desviación de 0,04. 


A) Determine un intervalo de confianza para el promedio con a = 0,01. 


B) Haga lo mismo con el total esperado en la zona donde hay 3 
502 residencias. 


Un nuevo programa es puesto en escena en una televisora en su 
horario estelar. Esperan combatir a su competidor con este. Se 
mide el rating durante en una muestra de 9 semanas y se promedia. 
Se obtuvo que la media del incremento fue de 14,1 puntos con una 
desviación de 8,8. 


Halle el intervalo de confianza para el promedio de incremento del 
rating del canal de TV. Use a = 0,01. 


En Omán se siguen utilizando los legendarios pozos del rey 
Salomón, instalados hace 2 500 años por este con la supuesta 
ayuda de un ejército de yinns. Del pozo principal (umm al falay) 
parte un túnel y los pozos aparecen escalonadamente, pero estos 
son un criadero de mosquitos. Para combatir la infestación de es- 
tos con mosquitos, se emprende una campaña en la que se rocía 
Temephos y se controla el índice usando una muestra de 50 sitios 
de monitoreo, situados aleatoriamente. En la muestra se obtuvo 
una media de 12,89 con una desviación de 7,95. 


Halle un intervalo de confianza para el índice promedio con a = 0,01 
para hacer el reporte a la comisión de control de plagas. 


Una muestra de 10 clientes habituales de una tienda es seleccio- 
nada y se les aplica una prueba para determinar el nivel de su 
manejo de las ofertas de crédito a las que puede optar. La califica- 
ción fue de 4,38 puntos con una varianza de 0,00359. 


Halle un intervalo de confianza del 95 % para la calificación pro- 
medio de la población. Y 


Se somete a una muestra de 9 gourmets una nueva receta de 
Bavarois de Banana en la que se sustituye la mermelada de grose- 
llas por una de ananás. Estos les dan una puntuación entre O y 20. : 
Se conoce que la distribución de sus puntuaciones es descrita por 
una distribución normal. En esta prueba degustatoria ellos 
promedian 15,75 con una desviación de 3,64 puntos. 
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60. 


61. 


62. 


63. 


A) Halle un intervalo de confianza para la calificación esperada 
para a = 0,10. 


B) Si la media de la Bavarias de Banana a la Grosella es de 17,8 . 
puntos, ¿considera que esta tiene un desempeño similar? 


Un egiptólogo analiza la dinastía de Omeya y encuentra vasijas en 
un asentamiento. En la muestra enviada al laboratorio se obtuvie- 
ron como resultados: 180, 184, 175, 207, 190, 210, 214,197, 192 y 
196. Determine un intervalo de confianza para una edad promedio 
de esas vasijas con a = 0,01. 


Un modisto pone a la consideración de un panel de 5 expertos, 
conformado aleatoriamente de una población de críticos de moda, 
un conjunto de chaquetas largas y semi entalladas para lucir de 
noche y en ocasiones formales. Las calificaciones fueron: 


Calificación No. de Panelistas 


Determine un intervalo de confianza para la calificación promedio 
de la crítica. 


Se hace una auditoría y se mide las Dollar-Tainted-Units de una 
muestra de cuentas en una dependencia. Se considera que estas 
son normales, bajo condiciones de adecuado control. En la mues- 
tra aleatoria de dependencias se obtuvo: 0,5; 2,7; 3,4; 0,01; 0,5; 
0,4; 1,3; 0,9; 1,9; 2,6. 


Halle un intervalo de confianza para a. = 0,05. 


Halle un el intervalo de confianza del ejercicio 16, al no asumir que 
la varianza es conocida. ¿Considera que esa hipótesis tiene un peso 
grande en las inferencias? 


. Se va a hacer la publicidad sobre un nuevo programa de adelgaza- 


miento, que combina una dieta en base a vegetales y proteínas con 
ejercicios del Yoga tradicional y se logra rebajar 3 kilos en dos me- 
ses. Los resultados, en kilogramos de rebaja, en dos meses fueron 
en una muestra de mujeres obesas: 4,5; -1,4; 2,4; 2,3; 7,8; -0,2; 5,6; 


- 0,2; 1,5; 2,3; -0,4 y -1,8. 
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Al asumir la normalidad, determine el intervalo de confianza que 
recomienda use la publicitaria con a = 0,10. 


65. El por ciento de accidentes con víctimas fatales en una ciudad es 
estudiado. En una muestra tomada de 28 accidentes ocurridos en 
el primer semestre de esta año este fue de 16,8 con una varianza 
de 23,95. 


Halle un intervalo de confianza que usaría para hacer a exposición 
del estado actual de este problema. 


66. Se monitorea una muestra de 25 recién nacidos y se mide a qué 
edad estos presentan cólicos, a qué hora estos se presentan y el. 
tiempo de duración. Los resultados obtenidos fueron los que apa- 
recen en la Tabla 3.6 siguiente: 


TABLA 3.6. 
Resultado sobre la edad, hora y duración 


medida de confianza 


. A) Halle los intervalos de confianza (complete la tabla) para a = 0,05, 


B) Diga qué cree de las afirmaciones siguientes: 
1. Los cólicos aparecen alrededor de las 3 semanas. 
2. Se presentan hacia el final del día. 
3. Duran alrededor de 3 horas. 


67. Se toma una muestra de 36 compradores habituales de CD's de 
música Salsa y se les hace una oferta de servicio de ventas elec- 
trónicas. Se obtuvieron ventas por 128,50 $ y una desviación de 45,60. - 
Determine un intervalo de confianza para las ventas esperadas por com- 
prador habitual al establecer la venta por internet, si usara o. = 0,05. 


68. Se analiza la aceptación de los servicios de un enclave turístico en 
los dos miembros de 6 parejas. Las respuestas se evaluaron en un 
intervalo [0,20]. Estos fueron (ver Tabla 3.7): 
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TABLA 3.7. 
Valoración de los servicios de un enclave 


rocio — MENCION DEDO ERC 
conte MEENINANDECO RETA IE 


ver RENCOR ET 


Halle un intervalo de confianza para el promedio de las diferencias 
aceptando la normalidad de las variables y que la varianza es de 36. 


(Sugerencia: tome las diferencias de las parejas como la variable 
aleatoria.) 


69. El recalentamiento climático es modelado utilizando las emisiones 
de gas carbónico, como agente principal de ese fenómeno. Ante 
16 escenarios generados aleatoriamente, se computa el aumento 
de temperatura en la superficie para el año 2010. Ellos promediaron 
8,12 *C con una desviación típica de 3,14. 


Halle un intervalo de confianza para el aumento de temperatura 
esperado con a, = 0,05, asumiendo la normalidad. 


70. Se toma una muestra de 30 grupos de gitanos dispersos por Euro- 
pa Central y se indaga por el número de agresiones hechas a ellos 
por grupos etnófobos. La distribución fue la que aparece en lá Ta- 
bla 3.8 siguiente: 

TABLA 3.8. 
Acciones etnófobas 


Número de Agresiones en el último año 245356 
Número de grupos que le reportan 8 910 3 


A) Estime el número de agresiones que se espera reciba una tribu 
de gitanos en esa zona y su intervalo de confianza. 


B) Si en una región hay 79 grupos dispersos, ¿cuántas agresiones 
considera se efectúan en ella? 


Use a. = 0,05. 


71. Una cadena de “Fast Food” analiza la aceptación de una nueva 
oferta en la que se incrementa la ración de patatas fritas en rela- 
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Oferta 18,45] 10,23] 19,41] 17,63] 20,00 | 13,72 | 18,63 166 94 
usual 
nuev: 


72. 


73. 


ción a la anterior, respecto a otra en la que la carne es de mejor 
calidad. Se seleccionan aleatoriamente comensales habituales y 
se les da gratuitamente las dos ofertas y se les pide que las valoren 
en una escala del O al 20. Los resultados dados a las dos ofertas 
fueron (ver Tabla 3.9): 
TABLA 3.9. 
Calidad asignadas a las dos ofertas 


Halle un intervalo de confianza para el promedio de las diferencias 
aceptando la normalidad de las variables. 


(Sugerencia: tome las diferencias de las parejas como la variable 
aleatoria.) 


La empresa Cuerolindo se lanza a la búsqueda de nuevos merca- 
dos en medio de una etapa expansiva de crecimiento del mercado. 
Hace un diseño de portafolio para ejecutivos que envía a 10 geren- . 
tes de alto nivel en el país, para que lo evaluasen en términos de 
una puntuación de la aceptación que debe tener entre sus cole- 
gas. Los resultados fueron que 1 le asigna una calificación de 2,7 le 
dan 4 puntos y el resto la máxima que es de 5. Al hacer el análisis, 
como la calificación se mueve en el intervalo [O, 5], se valora como 
una variable normal. 


Halle un intervalo de confianza para el puntaje esperado con un 90 % 
de confianza. 


Un habano debe fumarse con un 65 % de humedad, la que garantiza 
la conservación del aroma y sabor del mismo. Se fabrican unos 
humidores mucho más baratos que los herméticos de cedro con 
higrómetro. Se desea hacer la propaganda sobre la base de una 
garantía de la humedad que mantiene. Se toma una muestra de 6 
humidores de nueva tecnología y se mide la humedad que garantiza 
a su contenido. Los resultados fuéron: 56,9; 64,9; 62,6; 70,4 y 64,5. 


Halle el intervalo de confianza para la humedad que mantienen es- 
tos humidores y diga si los compradores pueden valorar como ade- . 
cuados estos, en vista de la humedad ideal que deben mantener. 
Use a = 0,10. 
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74. La bodega vinatera más popular de una región se precia de 
vender unas 5 000 botellas de vino espumoso por mes. Se 
toma una muestra de 5 meses en las cuentas de esta, y se 
“obtuvo 5 600, 3 210, 4560 y 6 700. 


Halle un intervalo de confianza para el promedio teórico de sus 
ventas con o = 0,05. : 


-75. Un importador de petróleo toma una muestra de 20 ofertas que 
hacen del crudo en el mercado. Obtiene que el promedio es de 
28 USD por barril con una desviación de 2,50 USD. 


Halle el intervalo de confianza del 90 % para el precio promedio por 
barril en el mercado. 


76. En su período de modernización una empresa valora incluir en la 
web las ventas de gadgets. Para ello hace una experiencia ponién- 
dole durante 9 semanas -seleccionádas aleatoriamente. En ellas 
promedió ventas de 150 560,45 USD por semana con una desvia- . 
"ción de 20 783,00 USD. 


A) Determine un intervalo de confianza para las ventas mensuales. 
B) ¿Cree que pueda superar la venta de 6 millones por año? 


77. Un editor selecciona de su staff a 5 críticos aleatoriamente y les 
envía dos novelas escritas por el mismo novel autor. Les solicita 
una evaluación de su potencialidad de venta en una escala del 0 al 
50. Se obtuvieron los reportes siguientes (ver Tabla 3.10): 


TABLA 3.10. 
Potencialidad de venta de dos novelas 


Halle un intervalo de confianza para el promedio de las diferencias 
aceptando la normalidad de las variables. 


Revisor a b c d e 
> - >” 
, st” 


(Sugerencia: tome las diferencias de las parejas como la variable 
aleatoria.) : 


Use a = 0,1. 
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78. Se hace un evaluación de un proceso evaluativo para aspirantes a 
plazas de programador de computadora. Una muestra de 16 es 
tomada de un grupo de jóvenes talentos y se les aplica una batería 
de pruebas y obteniéndose una calificación media de 120,70 de un 
máximo de 150 con una desviación de 11,59. Asuma que la distri- 
bución de la calificación es normal y use a: = 0,05 para determinar 
un intervalo de confianza. ¿Considera que este puede ser usado 
para determinar los aspirantes aptos en el futuro? 


79. Se sabe que la efectividad de un test de personalidad para determi- 
nar la capacidad creativa de adolescentes sigue una distribución 
normal. Se toma una muestra en cada uno de los dos grupos de 
jóvenes que acuden a consulta de dos psicólogos. 


A) Halle los intervalos de confianza para cada grupo. 
- B) ¿Los considera similares? 
Use a. = 0,05. Los resultados fueron (ver Tabla 3.11): 


TABLA 3.11. 
Efectividad del test de personalidad 


Y Tamaño de la A ES 
Grupo Media Varianza *' 
muestra 


80. Se establece un sistema de control en un aeropuerto para detectar 
el peso de equipaje no declarado. Los resultados son dados en la 
Tabla 3.12 siguiente: 


TABLA 3.12. 
Resultados del control del equipaje de mano 


Halle un intervalo de confianza del 90 % para el peso AOneda de 
equipaje de mano aceptando la normalidad, 


81. En una exposición de logros tecnológicos, una casa productora de 
equipos electrónicos toma una muestra de 60 minutos aleatoriamente 
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un día y mide el número de los qué acuden en ese intervalo al 
stand de juegos virtuales y les utilizan. Este fue de 85,32 con una 
varianza de 79,21. 


A) ¿Cuántos esperan lo hagan por minuto como promedio? 
B) ¿Cuál es total que espera lo hagan en las 8 horas abiertas?. 
Use a. = 0,05. 


82. Un programa de engorde es aplicado a pollos obtenidos de cruces 
de razas de engorde con la especie local. Se realizó un experimen- 
to y se seleccionó una muestra aleatoria. Acéeptando que la ganan- 
cia es una variable normal, halle el intervalo de confianza para los 
kilogramos promedio ganados (ver Tabla 3.13). 


TABLA 3.13. 
Resultados de un programa de engorde de pollos 


2,3; 1,2; 2,8; 0,4; 0,7; 1,9; 0,7; 1,0; 1,2; 0,7; 1,6; 2,5; 
2,8; 1,9; 0,6; 1,9; 0,4; 1,4; 0,8 

1,6; 0,5; 1,5; 1,2; 0,9; 1,5; 0,2; 216; 2,0: 1,4; 0,4; 23 
1,2; 1,6; 0,5; 1,2; 0,3; 0,7; 1,1 


Ganancia 


En peso 


Use a= 0,05. 


83. Se toma una muestra de 20 personas mayores de 60 años y se 
mide el nivel de alfabetismo funcional de ellos. La investigación 
persigue valorar el impacto de los adelantos tecnológicos en la 
sociedad moderna en el desempeño en la vida contemporánea de 
las personas de la tercera edad. Se considera que esta es una ' 
variable normal con varianza 225 y se obtiene una media de 64,38. 


Halle un intervalo de confianza con a. = 0,05, para el índice de 
alfabetismo. 


84. Se mide la altura de niños sometidos a radiaciones en edades tem- 
pranas. Una muestra de 20 de ellos con edad de 5 años fue selec- 
cionada en un hospital pediátrico. Estos promediaban 1,25 metros 
con una varianza de 4,67. Determine un intervalo de confianza para 
el alto promedio de la población con a = 0,05. 


85. Un etnólogo de la Iglesia Metodista estudia la sociedad ancestral 
ghanesa durante su visita el país. Toma una muestra de 20 tribus que 
se comunican en fantí y se entrevista con el okyeame del jefe tribal. - 
En esas entrevistas determina un coeficiente de occidentalización de 
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86. 


87. 


88. 


89. 


90. 


las interpretaciones de las leyendas. Los resultados fueron: 21,1; 
39,6; 72,0; 26,0; 69,2; 14,9; 31,5; 41,8; 60,0; 25,8; 99,3; 98,7; 97,6; 
99,1; 54,2; 7,7; 91,9; 59,8; 92,0 y 99,5. 


Halle un intervalo de confianza para la esperanza del coeficiente 
con a, = 0,01, si considera aceptable la normalidad. 


Se toma una muestra aleatoria de 200 débiles visuales, los que dan 
su apreciación sobre la nitidez de una imagen visual después de 
una sesión de yoga. La varianza computada fue 3,29. 


Halle un intervalo de confianza para a. = 0,01. 
A) Use la fórmula usual. 
B) Use la aproximación normal. 


Una revista cultural envía en forma gratuita sus ejemplares a deter- 
minadas instituciones de países pobres. Para valorar su efectivi- 
dad, toma una muestra de ellas para que llenen un cuestionario 
donde describen el uso que les dan a la, misma. A partir de las 
respuestas se calífica la efectividad del donativo en una escala del 
1 al 100. Se obtiene: 39, 38, 43, 45, 46, 48, 49, 50, 8, 5, 34, 39, 11, 
14, 16, 19, 22, 24, 26, 30, 32, 19, 45, 16, 30, 25, 28 y 21. 


Determine un intervalo de confianza para el promedio poblacional 
de la calificación entre los que obtienen el donativo con a = 0,05. 


El coeficiente de concentración de alumnos que forman parte de 
equipos de atletismo de alto nivel, es medido en 5 atletas seleccio- 
nados aleatoriamente. Si acepta la normalidad y s = 3, dde halle un 
intervalo de confianza para: 


A) 0? 

B) o 

con a. = 0,05. 

Se mide el tiempo utilizado en internet por los 20 investigadores 


muestreados en un instituto. Su varianza fue de 67,89. Determine 
un intervalo confidencial del 90 % para o. 


Se encuentra una biblioteca en una excavación en la que se halla. 
un asentamiento romano en el norte de África. El número de códi- 
ces de cada cuaderno es enumerado. Se considera que esa es 
una muestra aleatoria de la producción literaria de la ciudad. El 


- número de estos fue (ver Tabla 3.14): 
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91. 


92. 


93. 


94. 


95. 


TABLA 3.14. 
Número de códices 


Determine un intervalo de confianza con a = 0,05 para el promedio 
de códices por cuaderno. 


Se estudió el tiempo que puede asegurarse que un medicamento ba- 
sado en la espirulina duraba sin perder sus propiedades básicas. Se 
tomó una muestra de 100 unidades, se hicieron las pruebas y se ob- 
tuvo que la desviación típica fue de 100 días en condiciones extremas. 


Determine un intervalo de confianza para s con a = 0,05. 


Se desea valorar el conocimiento entre los estudiosos de la poesía 
del siglo Xvil del “estilo indio' en Persia. Se indaga en una muestra 
de 400 de ellos sobre la obra de Mirzá Mohamed Ali (Sáeb de Tabriz) 
y 136 obtienen una calificación como “de conocimiento suficiente”. 


Halle un intervalo de confianza con a; = 0,05 para el por ciento de 
los estudiosos que la conocen. 


Un lanzador profesional de pelota es sometido a un estudio de su 
velocidad después de una operación del codo. Los resultados en 
una muestra aleatoria de sus lanzamientos fueron: 81,2; 90,3; 94,6; 
76,5; 88,3; 87,5; 67,4; 63,2 y 75,4. 


Halle un intervalo de confianza para su velocidad promedio y para 
su desviación con a = 0,1. 


Se somete a reconteo los glóbulos rojos reportado por un analista y se 
obtuvo una varianza de 10,984 en una muestra de 50 tomas de sangre. 


Halle el intervalo de confianza para su desviación típica con a. = 0,01. 


Se toman 5 peces, aleatoriamente, de un fardo bajado de un bar- 
co pesquero y se obtuvo que tenían las longitudes en cm siguien- 
tes: 23,71; 34,90;"12,46; 28,54 y 46,27. 


A) Estime la media y la varianza. 


B) Acepte la normalidad y halle el intervalo de confianza para la 
media y la varianza. 


Use a = 0,05. 
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96. Un examen es desarrollado entre juristas y se evalúa su conoci- 
miento de los hitos más significativos en la historia de la jurispru- 
dencia utilizando una información de The World Legal Information. 
Los resultados obtenidos en una muestra de 500 abogados se 
obtiene que son considerados, como entre ellos, los siguientes: 


Cantidad de 
Hito histórico abogados que le 
señalaron 


Código de Dracón (623 AC) 158 


Declaración Universal de los Derechos 
Humanos (1948) 


A) Halle un intervalo de confianza con a: = 0,05 para el por ciento 
de abogados que identificaron cada hito. 


B) ¿Cuál es el tamaño de la muestra que propondría para otra in- 
vestigación, si acepta hasta un 10 % de error? 
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97. Expertos detectaron una afección en la trompa de los elefantes, en 
Zimbawe. La causa es una intoxicación con el plomo vertido en 
ríos con los desechos industriales. Se desea estimar la proporción 
de elefantes aquejados. ¿Cuán grande debe ser la muestra toma- 
da para tener una confianza de no menos del 99 % de que la esti- 
mación no difiere más de un 0,04 de la verdadera proporción? 


98. Una emisora de radio toma una muestra de 16 radio escuchas para 
indagar sobre el tiempo que la sintonizan en el horario de 8:00 a 
15:00. La varianza computada fue de 4,84. 


Halle el intervalo de confianza del 99 % de confianza para la varianza 
- teórica. 


Respuestas a Ejercicios Seleccionados 


1. 35,9 y 0,79. 
3. A) Es 3,98 y parece que sí, pues la desviación típica es pequeña. 


5. 8,61 y, como la desviación es de 0,18, confío sen la media para 
hacer un estudio del mercado. 


6. A) 2,75 B) 0,19. 
8. (215,78 253,78). 


10. Note que en este caso el por ciento es una variable en sí, pues los 
empleados seleccionados lo reportan. Entonces, la respuesta es 
(48, 77 58, 65). 

12. (68,34 76,94). 

14, No, pues el intervalo de confianza para a. = 0,10 es (2,40 2,80). 

16. (3040,67 3171,33),n > 42. 

18. B) Sí. C) Aproximadamente 84. 


20. (32,3 39,5) y n > 19. 


21. A) Muestreamos la producción de la línea en ese día, por tanto si 
“la eficiencia del auto” es sobre lo que se quiere inferir la pobla- 
ción objetivo, no es la muestreada. 


B) (33,54 36,02) 
C) 245 autos. 
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22. En este caso el tamaño de la muestra sostiene la normalidad 
asintótica de la media, por tanto, la respuesta es: ( 89,12; 93,38). 


23. (22,24 24,14), 3 399. 
25. Es aproximadamente (0,1496 0,1550). 
26. A) (3332,88 5163,12). 


29. A) Para el porcentaje P es (0,845 0,955), por lo que es entre 84,5 % 
y 95,5 % para el por ciento. 


B) Aproximadamente (422 477). 


30. A) Ofrezco (-1,26698 -1,23198), lo que establece que siempre se 
espera que sea menos que lo solicitado. 


31. B) Claro que no. 
32. A) (71,66 75,54) B) No. 


34. B) La población objetivo es bien diferente de la muestreada, por 
ello no puedo afirmar nada fuera cel club de lectoras muestreado. 


35. B) La población es muy diferente de la muestreada. 
37. (112,36 141,24) y ( 23,31 23,71). En el segundo. 
39. A) (5,46 5,90). | 
B) SÍ. 
41. (2,61 4,29). 
44. (8,46 8,76). 
46. (6,32 6,38). : 
48. (353,2 412,2). 
50. Aproximadamente (66,7 68,2). 
52. A) (46,37 66,5) B) Sí, es 0,995. 
55. A) (0,812 0,828) B) (2 843,62 2 899,66). 
57. (9,96 15,82). 
58. Aproximadamente (4,34 4,43). 
59. (13,49 18,01). SÍ 
61. (3,67 8,33). 
63. (2438,26 3773,74). Sí, pues los intervalos son bien diferentes. 


122. 


65. (14,46 19,14), y si se le habla de un 95 % de confianza. 


67. (113,60 143,40). 
69. (6,43 9,81). 
70. A) 4 y (3,50 4,50). 
72. (3,54 4,44). 
75. (27,46 28,54). - 
76. A) (509 134,0 695 349,6) 
B) Sí. 
78. (114,53 126,87). SÍ. 
79. A) (15,39 22,53) y (13,35 18,41). 
B) Parece que no. 
81. A) (83,055 87,585) 
83. (57,78 70,98). 
84. (1,03 1,72). 
86. A) (2,6 4,4). 
B) (2,6 4,5). 
88. A) (5,12 117,46) B) (2,26 10,83). 
90. Aproximadamente (18,0 21,8). 
91. (87,40 115,43). 
92. (29,4 38,6). 
93. (2,60 4,38). 
98. (2,21. 15,78). 
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Capítulo gq 
Pruebas de Hipótesis 


4.1. Introducción 


El otro problema básico de la Estadística Inferencial es el de establecer 

si ciertas hipótesis, prefijadas por el interesado, son suficientemente 

verosímiles. Esta verosimilitud es modelada a partir de la probabilidad 

de que el resultado obtenido sea observado si la hipótesis se cumple. 

Podemos usar como hipótesis el hecho de que un parámetro O sea 
igual a un valor hipotético 6, . La muestra observada permite evaluar un 

estadígrafo d(x,,....x, ) = d el que sigue una distribución: 


F(8 16). Si9 = 0, entonces P(SeQ (0) = P(Se Q10,). Se denomina como 
estadígrafo de prueba a d. 


Hay dos posibles situaciones: 

1. H,: 6 = 6, (Hipótesis Nula). 

2.H,: 050, (Hipótesis Alternativa). 

Al tomar la muestra podemos tomar dos posibles decisiones: 
1. Aceptar H, 

2. Aceptar H,. 

Entonces, tenemos el cuadro siguiente (ver Tabla 4.1): 


TABLA 4.1... 
Posibles errores al tomar una decisión 


Decisión Estado de la Naturaleza 
Se cumple A. Se cumple H, 

e Pe Todo Bien Error de Tipo 2 
Pp l Error de Tipo 1 Todo Bien 
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Al hacer una prueba aceptamos una de las hipótesis; pero nunca sa- 
bremos si esta fue correcta o no. A partir de computar d(Xx,,...,X ) to- 
maremos una decisión sobre cuál de las hipótesis aceptar. Usando su 
distribución se determinan un par de conjuntos de sus posibles valo-: 
res S, (Región de Aceptación) y S, (Región de Rechazo o Crítica). 
Estas son determinadas y tenemos la siguiente caracterización del 
proceso de decidir que hipótesis debe ser aceptada. 


Definición 4.1. (Prueba de Hipótesis). Sea d(x,,....x,) un estadígrafo de 
prueba. Una prueba de hipótesis es un procedimiento tal que : 


1. Aceptamos H, si o (Región de aceptación). 

2. No aceptamos H, si d(X,,....x eS, (Región Crítica). 

El problema de determinar estas regiones está guiado por el hecho de que 
(ver Tabla 4.2): 


TABLA 4.2. 
Probabilidades asociadas a una Prueba de hipótesis 


Decisión Estado de la Naturaleza 


Se nl Se cumple A, 
PídeS,|H,)=1- a |  P(deS,|H,)= =B 
P(deS, e a | P(deS, (+7) = -B 


Aceptar A, si deS, 
Aceptar A, sideS, 


Al situar en la H, la relación sensitiva, se garantiza que al aceptarla la 
probabilidad de equivocarse es un valor a, que es controlado y es 
conocido como nivel de significación de la prueba. Si este está cerca 
de cero, la aceptamos. Un método es fijarle , es conocido, o es com- 
putado al obtener el valor de d en la muestra. 


Es ideal que 1 — $, potencia de la prueba, sea un valor cercano a 1. 
Lamentablemente esta probabilidad es difícilmente controlable, solo 
puede ser calculado para valores alternativos a 0,. Si en realidad 6, +* 
09, pero están muy cerca, es difícil detectar la existencia de esta dite- 
rencia, lo que se refleja en el valor de $. Si deseamos detectar un 
cierto nivel de las diferencias posibles, deberemos usar la potencia 
para fijar el tamaño de muestra necesario para hacerlo. 


La teoría establece métodos para desarrollar pruebas e hipótesis que 
para un cierto nivel de significación tengan una potencia máxima. 


En general, veremos en este capítulo los siguientes problemas de prue- 
ba de hipótesis (ver Tabla 4.3): 
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TABLA 4.3. 
Casos posibles a estudiar en las pruebas para 0 


En este capítulo se tratarán problemas paramétricos, asociados a la 
distribución normal. En el capítulo 7, se tratarán otros casos, como los 
asociados a pruebas sobre las proporciones cuando el tamaño de la 
muestra no soporta la aproximación normal. 


4.2. Pruebas para la media 
4.2.1. Pruebas para la media con varianza conocida 


Al tomar una muestra de tamaño n de una población con distribución 
N(u, 0?) tenemos que: 


y si: 


Ao Lz YA a aceptar H, 
f= bl 
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Otro estadígrafo de prueba puede ser: . 
Para d = X 
y si: 


¿Uy + z aceptar H, 


LEE = 
| tr = ¿vn al 

Note la similitud con el razonamiento utilizado para determinar un inter- 

valo de confianza. Entonces, la prueba de hipótesis correspondiente es: 

Prueba para H,: u = y, vs H,: 1%, con o conocida 

Aceptar H, sí: 


deS, => 


Ejemplo 4.1. Se toma una muestra de 26 niños de 7 años de edad y se 
obtiene que su estatura promedio. es de 1,48 m. Los estudios de tablas 
existentes fijan que la estatura es una variable con distribución N(1,35 
0,25). ¿Puede decirse que para la población de la que provienen, esa 
es la media? Use un nivel de significación del 0,05. 


Solución 
HA, 4 = 1,35 vs H, : 14 1,35. 
Entonces: 
Para d =X 
5 = hz ED 2 Josie Jus =l- hi9, 1,51 
IS ln Es Án 6 
e 
Para d =d= a Je 
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Si usamos x. = 1,48 como este valor pertenece a ]1,19, 1,51[ y acepta- 
mos que u = 1,35. Si utilizamos el otro estadígrafo tenemos que d = 1,56, 
que como es de esperar no pertenece a la región crítica y la misma deci- 
sión tomada. 


Para los otros casos, un razonamiento similar: 
Si H,: 4 > u, tenemos: 
Prueba para H.: 4 >, vs H,: H < u, con o conocida 
Aceptar H, si: 
X- Mo 


alWn 


deS,=> 


e 2 + 


Ejemplo 4.2. Se desea determinar si las truchas criadas en estanques 
artificiales tienen un peso menor que las obtenidas en la pesca tradi- 
cional en los lagos. De aceptarse una, la alimentación que se les da 
debe ser analizada. Estos tienen un promedio histórico de 0,652 kilos y 
una desviación típica de 0,3. Se selecciona una muestra aleatoria de 16 
truchas pescadas en estos estanques. Estas promediaron 0,407 kilos. 
¿Acepta Ud. esta hipótesis con a. = 0,01? 


Solución 


Ahora H,: 1 > 0,652 vs H, : f < 0,652 y O = 0,3. Nuevamente analizare- 
mos cómo hacer la prueba usando los dos estadígratos. 


Para d =X 


S, = ho al [posa 235 Je] -Jo302s oo| 


y acepto H,pues X = 0,407 y este es mayor que 0,3025, como: 


a, sy= 2 arool=)- 233,00 | 


0/4n 


Está claro que el otro estadígrafo va a determinar la misma decisión. 
Note que este toma valor d = -1,902 que está en S, . 
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Por otra parte, cuando el problema a analizar nos lleva a que H,: 4 <p, 
trabajamos con: 
Prueba para H.: 1 < y, vs H,: > con o conocida 


Aceptar H, si 


X—Ho 


s/n 


AA | 


Ejemplo 4.3. Se toma una muestra de 9 mujeres afectadas con un car- 
cinoma alveolar/bronquial que estuvieron expuestas a vinylcycloxene 
diepoxide durante un período largo. La media, como resultado del test 
de BielerWilliams ajustado teóricamente es una variable normal stan- 
dard si este tóxico no tiene influencia en el desarrollo del cáncer. El 
resultado obtenido tuvo promedio de 0,78. ¿Considera que este es 
significativamente mayor que cero? Use a. = 0,1 y o = 0,3. 


Solución 
En este caso H,: L<0 H,: > 0 
X = 0,78 


> Zia 


deS, => 


50) 09,220 2 = Io, 0,164 aceptamos H, 


Ejemplo 4.4. Se toma una muestra de 9 actores de una generación y la 
media del estudio de sus capacidades histriónicas, la que es conside- 
rada una variable normal, fue de 0,105 con una varianza de 0,04, Cuan- 
do u = O se considera que el grupo es 'nominalista”. Diga si no clasifica 
así la población de la que provienen, usando a = 0,1. 


Cuando d = X 


A ls is 
y acepto H, 


X- Ho 


s/n ” S,=+o,Z,.[=Lo, Leal 


Para d= 


donde d = 2,3636 
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4.2.2. Pruebas para la media con varianza desconocida 


Al tomar una muestra de tamaño n de una población con distribución 
Nu, 0?) al estimar la varianza usando S? 


a E an ly 
AE ds ria 1D Srl 11) a led 


por tanto podemos probar: 
A. u4=p, VS A,: 4%, 
y ahora los posibles estadígrafos y las correspondientes pruebas son: 


_X-h, 


Sa 


E Mo Q » a 
-1,1) -—y,T -1,1) -— : 
SE ep ria 1,0) a (a 1) a aceptamos H, 


Por su parte, para el otro estadígrafo de prueba: 
d = X 
SÍ: 


y si: 


> ay Ss aysS : 
Xe la rt er aceptamos H, 


Por tanto, las nuevas pruebas de hipótesis son las adecuaciones he- 
chas al sustituir o por su estimación y utilizar la correspondiente distri- 
bución T-Student. Ahora estas son: 


Prueba para H,: 1 = y, vs H,: 1 + u,con o desconocida. 
Aceptar H, si: 

Xt rm 
0//n ao O 


he ay Ss : as 
XeEj] =T|n-11-— |—=, Up +71 n-1,1-— -= 
E SJ aL 


Ejemplo 4.5. El estudio de hábitos de vida de sinsontes en cautiverio 
arrojó que estos consumen 85,3 gramos de alimento concentrado como 


deS, => 
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promedio. En una muestra de 4, observados en su hábitad natural, se 
estimó este en 77,9 con una varianza de 1,21. Se acepta que la distri- 
bución es una normal. Diga si la media del consumo es igual a la que 
se esfectúa en estado de cautiverio con a = 0,05. 


Solución 
Al usar d = X como X = 77,9 acepto H, pues: 


aySs aySs 11 11 
S= =T131-— ¿4 +T | 3,1-= 2] = 85,3-2,776| = 185,34+2,1761 = 
o pa 2 Na al (3) El 
= 3,77, 868| 


X— My 


0//n 


y para d= se obtiene el valor 13,45 


siendo: S, =1-2,776, 2,776| 


Ahora si H,: p > 1, la prueba es: 
Prueba para H,: 1 >, vs H,: H < u,¿con o desconocida. 
Aceptar H, si: : 


2 bo Tr (n-11-0) 


S/n 
Xe | =Tla=t1-0) | 


Ejemplo 4.6. Se aplica un fertilizante natural en campos de caña de 
azúcar y se desea determinar si el aumento del rendimiento es menor 
que el obtenido con abonos químicos. En una muestra de 16 parcelas 
se obtuvo un rendimiento de 88 200 arrobas por caballería. El prome- 
dio obtenido con los otros fertilizantes es de 95 600. Si la desviación 
típica computada fue 3 250,8. Diga si acepta la hipótesis con a = 0,01. 


deS,> 


Solución 
Como H,: 1 > 95 600 y H,: y < 95 6000 tenemos que: 
Parad=Xyn = 16 


S, = seo E | = P3485,355, co | 


pues T(15, 0,99) = 2,602 y como x = 88 200 no acepto H, 
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Solución 
Las hipótesis son: H,: y < y, vs H,: 4 > H, 
En la muestra n = 9 x = 0,105 y s? = 0,04 por lo que: 


dE y, =1-2,602, co] 


Para el caso H,: U < y, vs H,: 4 > y, entonces la prueba es: 
Prueba para H,; y < y, vs H,: > con o desconocida: 
Aceptar H, si: 

X Ho 


S/ln 


xo +T (n-1,1-0) ña 


> —T (n-11-a) 


deS, > 


Ejemplo 4.7. Utilizando los datos del ejemplo 4.4, considere S = 0,2 y 
haga la prueba correspondiente. 


Solución: 
Las hipótesis son: H.: uy<0 vs H, :4>0 
En la muestra n = 9 X= 0,105 y s? = 0,04 por lo que: 


552 Jo 768, 0007 > bo ae] ho 0,0931 


y Ni H, 


Ahora EP. =1575,  S,=bow,  1397| 


s/n 
4.2.3. Pruebas para medias de poblaciones no normales 


Si la variable no es normal y el tamaño de la muestra es grande, gene- 
ralmente sin > 30, podemos utilizar la aproximación dada por el Teore- 
ma Central del Límite y aceptar que: 


hito a 2, [Juro 
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Por tanto, si n es suficientemente grande y conocemos la varianza, 
podemos usar los resultados expuestos en el epígrafe 4.2.1. Si la 
varianza no es conocida puede usarse el hecho soportado por este 
teorema de que la media muestral tiene una distribución normal 
asintótica. Por ello, al estimar o? usando S? tenemos un estadígrafo con 
distribución T(n — 1) el que a su vez, al ser n suficientemente grande, 
converge a la distribución N(0,1). Por ello, las pruebas brindadas en 
4.2.1 son utilizables. 


Ejemplo 4.8. La primera edición de Paradiso de José Lezama Lima 
está plagada de erratas. Muchas de ellas fueron atribuidas a la inten- 
ción del autor de crear nuevas locuciones. Se toma una muestra de 
144 noveles intelectuales y se les hace leer esta voluminosa novela para 
que detecten los errores y los contabilicen. El promedio de los errores 
diferentes detectados por ellos fue de 18,2 con una desviación de 8,3. 
Validan esos resultados que la población de lectores que ellos represen- 
tan no detecta más de 20 errores con un nivel de significación de 0,05. 


Solución 


El número de errores detectados no es una variable normal, pero n 
- puede ser considerado “grande”. El problema de prueba de hipótesis 
es Hu >20 y H,: u < 20. 


- Como o es desconocida aceptaremos H, si: 


a = 4249 <—T (143, 0,95)= 1,645 = Zoo, 


—S/dn 
como d = -2,6024 diremos que los resultados validan el hecho de que 
detectan menos de 20 errores. 


4.2.4, Pruebas para Proporciones 


Al trabajar con proporciones si n > 30, la aproximación normal de la 
Binomial permite aceptar que se cumple aproximadamente : 


=P ' 
a ia 
PAP) Ls 


donde: 
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p: es la proporción en la muestra, la media, y 


P: la proporción desconocida, la probabilidad de que la variable Bernoulli 
definida tome el valor uno. 


La varianza es desconocida, pues P no se conoce. Estimar o? = P(1 -— P) 
usando S? = p(1 — p) es aceptable, pero si fijamos que P = P, esto 
determina que o? = P,(1 - P): 


P Es 2 aL 4 AN 
EN 
n 


Entonces, las pruebas presentadas, en 4.2.1 son utilizable para hacer 
pruebas de hipótesis. 


Ejemplo 4.9. Se estudia el impacto de la globalización en el cambio de 
la estructura de los departamentos de Relaciones Públicas de las em- 
presas, con un capital de más de 5 millones de dólares en un país. Una 
muestra de 100 empresas africanas es tomada y su futuro, analizado 
por una fundación europea. Se obtuvo que el 77,8 % de ellas debían 
cambiar la estructura de estos departamentos. Puede decirse que no 
menos del 75 % de ellas debe hacerlo. Use a. = 0,05. 


- Solución 
Tenemos que n > 30 y que p = 0,778. 
Debemos ver si es válida H,:P > 0,75 

p-0,75 


0,75 -0,25 
100 


aceptable:es decir que P < 0,75. 


como > 1,645 * no es válida pues el valor de d es 0,2592. Lo 


4.2.5. El uso de paquetes estadísticos 


Al usar un paquete en el que se computan los estadígrafos de prueba, 
estos dan la oportunidad de utilizar el cálculo del P-valor. Este no es 
más que el cálculo de la probabilidad de que el estadigrato de prueba 
esté lejos de cero, si H, es cierta. Si este es pequeño, se acepta que la 
aleatoriedad no debe estar generando valores de esta magnitud. Por 
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tanto, sólo aceptamos la hipótesis H,, si consideramos que el P-valor 
está suficientemente cerca de cero. 


Ejemplo 4.10. Se estudia el número de horas semanales que em- 
plean ante la computadora estudiantes de ingeniería para hacer pla- 
nos. Se toma una muestra de 7 y se desea probar si u = 9 es acepta- 
ble. Se obtiene la siguiente salida de la computadora usando Minitab 
(ver Tabla 4.4): 


TABLA 4.4. 
Salida de Minitab sobre el uso de la computadora para hacer planos 


C1; 
TIVE 0 Ñ 
VS MU |N.E. 9,000 
MEAN —[STDEV SEMEAN | T P- VALUE 


¿Qué puede decir sobre ella? 
Solución 


El P-valor es menor que un a. = 0,01; por lo que aceptamos H,. Note 
que T = 4,90 es mayor que T(6, 0,99) = 3,707. 


MU=9,000 
N 


4.3. Pruebas sobre varianzas 
4.3.1. Pruebas para o? 


Al interesar hacer pruebas sobre la dispersión, el parámetro a analizar 
es o. Si la variable es normal, sabemos que: : 


pe E (eo Je (o—o E, Jaro 


Entonces si es H,: 0? = o? es cierta 


402 
qe lefeos pelao | - S.|H, ro 
> . 


Las hipótesis unilaterales son describibles en forma similar, por lo que las 
pruebas sobre relaciones con un valor hipotético q? se realizan de acuerdo 
alas pruebas que aparecen en la Tabla 4.5 con las Pruebas para la varianza. 
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TABLA 4.5. 
Pruebas para la varianza 


Estadígrafo Aceptar H, si se cumple la 
de Prueba relación 


H,y0%=0 4 vs H : 0407, Vel, 0/2), y? (11, l-a/2) 
H, 020 vs H ,: 0*<0?, V < 1? (n, a/2) 
Hyo%o¿ vs H ¿007 |. V> y?(n1, 1-a/2) - 


Ejemplo 4.11. Un estudio es realizado sobre la variabilidad del compor- 
tamiento de un generador de electricidad solar. Es el interés del estu- 
- dio establecer si el voltaje que garantiza tiene una varianza de 30, si la 
varianza de la duración de la carga es menor que 14 y si la varianza del 
gasto de la maquinaria es mayor que 22. Se utiliza un nivel de significa- 
ción del 0,05 para hacer las pruebas correspondientes, al seleccionar 
una muestra de 50 instalaciones industriales. Lo resultados fueron: 


Voltaje: s? = 39,87 

Duración de la carga: s? = 10,21 
Gasto de la maquinaria: s? = 42,95 
Solución (ver Tabla 4.6) 


TABLA 4.6. 
Pruebas para la varianza 


Estadígrafo de 


Problemas Decisión 


Prueba 


Voltaje: Como pertenece a 


H/¿0%0? vs H,:0%0”, [29 :39,87/30 =38,541 | S,=]16,04 45,72[ acepto H, 
Duración: Como no es menor que 
H,y¡0%20f/ vs H,; 0%<g? [29 - 10,21/14=21,149 | y*(29, 0,05) = 17,71 acepto H, 
Gasto: Como es mayor que 


H¿0%<0/ vs H: 050 


29 -42,95/22 =56,615 | x*(29, 0,05) = 42,56 acepto H, 


4.3.2. Comparación de dos varianzas 


Sitenemos dos pobláciones normales N(u,, 0%) y N(u,, 07, ), nuestro inte- 
rés puede ser establecer la validez de hipótesis sobre las relaciones 
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que existen entre ellas. La prueba se hará utilizando las varianzas 
muestrales: 


S|x,-X 
¿q 
5; = n-1 
ñ Y 
(1,7 
S; = 
m-1 


donde las muestras (X.,...,X_) y (Y... Y, ) son independientes. Conside- 
raremos que S?, es la de mayor valor de las dos varianzas computa- 
das. El estadígrafo de prueba es: 


la que sigue una distribución F-Fischer con n - 1 y m - 1 grados de 
libertad. La prueba para: 


. 2 2 . 2 2 
A;:0¿=0/ vs H;: 0,40, es 


si: 
F> F(n-1, m-1, 1-0) 


Aceptar H.. 


Ejemplo 4.12. En el Caribe se desarrollan dos huracanes al mismo tiem- 
po: Fefita y Gloria. Se toman muestras en varios instantes de las velo- 
cidades del viento. De Fefita se toman 10 y se obtiene que la desvia- 
ción observada es de 25,3 km por hora y en las 15 seleccionadas es de 
73,7 m por hora. ¿Puede decirse que las variaciones en las velocida- 
des son iguales? Use a = 0,05. 


Solución 


Tenemos que computar las varianzas que son: S, 2= 640,09 y 
S/= 1135,69. ComoF = 1,7743 y F(9,14, 0 ,95) = 2,65 acep- 
to la igualdad de las varianzas. 


Note que esta prueba también es válida para H,: 0,?>0,? vs 
EE SO 
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En 


4.4. Pruebas para la diferencia de medias 
4.4.1. El problema general 


En muchas ocasiones, el interés es comparar las medias de dos po- 
blaciones. Hay dos variantes para ello. Una es tomar muestras en pa- 
res considerados similares. Tal es el caso en que se evalúa una varia- 
ble antes y después, o en una pareja, como los nacidos en una misma 
camada, los esposos, dos unidades producidas bajo las mismas con- 
diciones, excepto una cuya influencia quiere valorarse, etc. En este 
caso se dice que trabajamos con muestras pareadas. El otro caso es 
cuando seleccionamos las unidades en forma independiénte. En am- 
bas nuestro interés será establecer si las medias de las ii: 
evaluadas satisfacen una cierta relación. 


Sea X la variable evaluada en la población 1 o en el elemento 1 del par. 
Esta posee una media y, y varianza o*,. Si Y es la variable evaluada en 
la otra población u, y o*, son los correspondientes parámetros. Nue- 
vamente establecer relaciones entre ellas generan el mismo problema 
analizado en la sección 4.2. $ 


4.4.2. Muestras pareadas 

Al evaluar un par obtenemos n observaciones (X, Y) y podemos definir: 
D,=X -Y,i=1,...n 

Tomando esta nueva variable su media es: 


ElX, -Y,)= E(D,)= Mx 7H, =Hp 


y: 
v(D,)=05 

por tanto: ' 

LEER 

X-Yf=“L-=p 

n 
estima: 
Mx "My =HMp 
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Entonces, nos encontramos ante el caso usual de una variable con 
distribución normal y varianza conocida, si X y Y son normales. El pro- 
blema es que. 


O) =0% +07 20 yy 
donde: 
O xy = El(x =Hx XY =H, )] 


es casi siempre desconocida dado que, usualmente, las variables en el par 
no son independientes. Su estimación es realizada usando el estimador: 


D- Hp 
Sp/«/n 


es una variable con distribución T-Student con n - 1 grados de libertad. 
Entonces, tenemos que al plantear: 


A; 4,=4, 2 A, 4,=0 y que H :1,%0 


La prueba es 
Aceptar H, si: 


O sea si: 


De 136 le NÓ ile ra! 


Ejemplos 4.13. La obra de Goya concluyó la serie Caprichos, la que está 
ligada a su enfermedad hacia 1792. Se toman las 80 obras y se someten 
a la valoración de una muestra de 64 matrimonios, con más de 20 años de 
unión. Estos deben dar una calificación individual a cada cuadro, en una 
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escala del 0 al 10, en la que se refleje la aceptación de este como elemen- 
to decorativo en su hogar. Se desea establecer si ambos cónyuges tienen 
el mismo criterio. Para ello se computa el total de puntos y la diferencia en 
cada pareja. Se obtuvo que la media de las diferencias fue de 8,6 con una 
desviación típica de 29,9. Puede aceptarse que u, +, con a = 0,1. 


Solución 
Como: 


a D 86 
25,7 299 
e 


= 2,301 


y como 7(63, 0,05) =1,67 aceptamos que son diferentes las valoraciones. 


La prueba para H,: 1, > 1, consiste en aceptar H,: y < y, Si: 


T, = <—T(n-11-a) 
a 
o lo que es igual si: 
e S 
D>T(n-11-a)2 
( a 


y para H,: 1, <u, o lo que equivalentemente si H,: m, < O contra 
H,:4 ,1 > O. La prueba consiste en aceptar la hipótesis alternativa si: 


T, = a >T(n-1,1-a) 


S»/Vn 


-O lo que es igual si: , 


S Sd 
De ro 1,1 a | 

Ejemplo 4.14. Se toma una muestra de 49 niños catalogados como 
desnutridos. Se toma su peso en kilos antes y después de suministrar- 
le una dieta alta en aminoácidos y proteínas durante un mes. La media 
del aumento de peso fue de 0,208 kilos y la varianza computada fue 
0,645. ¿Puede decirse que se obtiene una ganancia con esta dieta, al 
cabo de un mes, con un nivel de significación del 0,01? 


Solución 


Nos interesa establecer si 1, <0 (H,), lo que sugiere que la dieta no es 
adecuada contra y, > 0 (HF), lo que haría que se recomendase generalizar 
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a 


“su uso entre niños desnutridos. D = 0,208 y s,= 0,8031. Tenemos 
que aceptamos H, pues como 7(48, 0,99) = 2,403 la región de acepta- 
ción es S, = ]-0>, 2,403 - 0,8031/7[=]-00, 0,275L. 


4.4.3. Muestras independientes 


4,4,3.1. Variables normales y varianzas conocidas 


Al seleccionar dos muestras independientes tenemos (X,,...,X_) y 
(Y,,....Y, ). Las hipótesis que pueden plantearse son las mismas que las 
- del caso pareado y los estadígrafos de prueba alternativos son: 


geo YD 
O VD) 
n m 
y: 
D 


y la prueba de la hipótesis 


H,: Mx = My = Hp =0 vs H,:1,%0 


se hace utilizando: 


si usamos: 


2 2 2 2 a 

O O O O a a 

Za y =Z RE +Z E si D 
27 n m Ls n m . 


Ejemplo 4.15. Se estudian los hábitos alimentarios de mujeres de dos 
estratos sociales, para estimar la forma en que consumen sus calorías. 
La variable “por ciento de calorías consumidas antes de las 14:00 "es 
normal con varianza 67,8 en el estrato de clase media baja y 45,9 en el 
de clase media superior, de acuerdo con los resultados de un censo 
realizado en el país. Se toma una muestra de 6 mujeres en el primero 
y se obtiene que estas consumen como promedio el 35,9 % de las 
calorías antes de las 14:00 horas. En el segundo, la muestra fue de 9, 
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y el promedio, de 57,3. Diga si considera iguales las estructuras de 
consumo calórico con una significación del 0,1. 


Solución 
En este problema tenemos que: 


D-= Eb -= 35,9 -57,3 --40 
0,9 [678,459 
n m 6 9 


-D=-21,4 
Como Z,.= 1,645 aceptamos que son diferentes los por cientos de 
consumo. 
Para las otras hipótesis: 
Si HH, 4, 2h, 20 vs H,:1,<0 


utlizamos:. ] 
S,= IS 00,Z yal 
para: y 
25 
y: 
- O EAN 
n m 
, Para: 
D 
- Cuando: 


H,' 1, My, =H, <Ovs H,:1,> 0 


So > Lo,z,,l 
al usar Z, y: 


si D es usado. 


Ejemplo 4.16. Una prueba de palatabilidad es llevada a cabo entre 
hombres y mujeres con la Torta Tropical de Coco que oferta un res- 
taurante. 10 comensales masculinos y 10 femeninos es seleccionada 
en un día, en forma independiente. Se dice que la varianza esperada 
es de 9 puntos para los hombres y de 16 para las mujeres. En la muestra 
se obtuvieron como medias de la palatabilidad 87,3 y 76,3 puntos. 
¿Les gustó más a los hombres con una significación de 0,01? 


Solución 


-—ComoH,:p,<0 vs HH, > 0y: 


So = Ex,Z,yo| = hoo,2,33| 


o sea, que aceptamos H, pues: 


z = A 


Ss 80,63 — 76,13 2.848 


4.4.3.2 . Variables normales y Varianzas desconocidas 


Con dos muestras independientes y varianzas desconocidas debemos 
estimar o?, y o”, usando las varianzas muestrales S?, y S?,. Silos tama- 
ños de muestra son grandes tenemos que: 


A 
D 2: 2 - 
E 3 AD) 

n m 


mientras que si usamos D: 
Ze DA 2 2 
a A Ni IN E : 
ASE n m ES: n m 


144 


para la prueba de la hipótesis 
H;¿: Hz — My =p =0 vs HH: %0 


Ejemplo 4.17. La valoración hecha de dos exhibiciones de moda por 
mujeres es plasmada por una muestra de las que acudieron. Una de 
ellas daba peso al romanticismo y la otra a lo sexy. En la de estilo 
romántico se seleccionaron 36 mujeres y la media de sus evaluaciones 
fue de 8,92 puntos de 10 posibles con una varianza de 144. En la ropa 
sexy las 25 seleccionadas tenían una media de 9,76 con una varianza 
de 125. ¿Son iguales las esperanzas de la calificación de ambas colec- 
ciones con una significación del 0,1? 

Solución 

A partir de que nuestra hipótesis es que las medias son Iguales; calcu- 
lamos: 


ds O ce AA 892-976 _ 073 


ss fl44 125 ” 

e A pia 

E 36 25 
d=-084 


Como Z, ys = 1,645 (S, =] -1,645, 1,645[) aceptamos que las mujeres 

valoran con la misma calificación la línea sexy y la romántica. Note 

pa al usar la diferencia de las medias la región de aceptación es 
S,=]-4,935 , 4,9351. 

Las pruebas para las demás hipótesis son: 


Si H,: 4,20 vs H,:,<0 


utilizamos: 
So + PE co[ 
para T,* y: 
2 2 
2. 2 ad | 
Rn m 
para D 


y para H,: u,<0 vs H,:4,>0 


So = S Za 
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al usar T*, y: 


si D es usado. 


Ejemplo 4.18. Se prueban muestras de CD's producidos por dos fir- 
mas. La fidelidad de las grabaciones en 90 unidades seleccionadas de 
los stocks de CD's de la firma 1 promedia, un índice de 4,83 con una 
varianza de 4,86. La muestra 30 CD's de la otra firma es tomada en 
forma independiente. La varianza computada en esta fue de 1,39 y la 
media de 5,86. ¿Es peor este índice para la firma 1? Use como nivel de 
significación de 0,05. 


- Solución 
Tomando X como el índice de fidelidad de los CD's de la firma 1 
Hx — My = H- entonces Ho:H; 20 vs H,:p, <0 


So = 1-1,645, col 
por lo que aceptamos H, dado que: 


r*- d ze 4,83 — 5,86 7 - 1,03 = -3,2523 


In 0,3167 
O 
90 — 30 


Cuando los tamaños de las muestras no son grandes, la aproximación nor- 
mal no es aceptable. Si las varianzas son iguales, el estadígrafo de prueba es: 


E mE 
D S, EN Sp Vn+m 
n m 
donde: 
n me 2 m ad 2 
a e EX) +2(07) 
a n+m-2 n+m-2 


Este sigue una distribución T(n-+m-2) por lo que las pruebas son: 


H,:p.=0 vs H,:4_ +0 
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S, E NE | 


si usamos 75 y para D: 


5, prfsmao-S)s, +27 rfinsm- ), al 
2 n m 


Para aceptar al igualdad de las varianzas, deberemos aplicar una prue: 
ba de hipótesis para compararlas. Vea la sección 4.3. 


Ejemplo 4.19. Se toma una muestra de 10 empresas que han obtenido 
préstamos de un banco. La deuda promedio fue de 7 881, cientos de 
miles de pesos, con una varianza de 170,65. En otro banco se toma 
una muestra del mismo tamaño y la media fue de 5,758 con una varianza 
de 110,08. Se quiere saber si las empresas endeudadas con los dos 
bancos tienen la misma media con una significación del 0,01. 


Solución 
Como: 
_ 170,65 _ 155 
110,08- 
y: 


F(099  99)=5,35 aceptando que 03=0? 
por lo que: 


_ (—1)s; +(m-1)57 _ 9-170,65+9-110,08 


= 140,36 
n+m-2 , 18 
- siendo: 
ps 7,881 -— 5,758 =0.42 
Ds 1 1 
140,36| — + — 
10 10 
aceptamos: 
H,:1.=0 
D 
pues: 


T(0,995 18) = 2,88 
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Las otras pruebas se llevan a cabo a partir de utilizar los mismos razo- 
namientos para deducir las reglas, dados los casos. 


H,:p_20 vs H,:p. <0 


S, = 7 (n+m-2),(1-02),00][ 


si usamos 7; y para D: 


So = | 
n m 


H,:u_S0 ws Hip >0 


S, = oo, T[(n+m-2), (11-001 


es la usada para T, y para D: 


9 parlirem=a. aces, Pz] 
n m 


Ejemplo 4.20. Una nueva pomada es desarrollada para restablecer la 
pigmentación de la piel. Se toma una muestra de 8 pacientes en la fase 
evolutiva aguda, y 14 en la fase evolutiva inveterada. Se mide el por 
ciento de la superficie que recupera su color original y se obteniene: 


Fase Tamaño 
AR Varianza 
evolutiva MOE la AR 


Aguda 1 ll: HO MT MT 


Diga si los pacientes en la fase inveterada tienen un mejor resultado 
con el tratamiento usando a = 0,05. 


Solución 
5 3 39,7 
Tomando x= 25,7, y =17,6 como AO y 


F(0,95 7,13) = 2,84 al utilizar D determinamos: 


S,= -o,Tl(n+m-2),(1-00)S, pal 
m 
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pues: 


es la usada para Te y para D. 
Entonces aceptamos H, ya que: * 


p - 170,65 =155 
110,08 
F(0,99 99)=5,35 entonces 0% =0; 
por lo que: > 
vs 7-20,6+13-39,7 = 660.3 
20 
siendo: 
L E 
660,3 E + as 
8 14 : 
pues: > 


T(095  22)=1,72 
Si no aceptamos que las varianzas son iguales, tendremos que utilizar: 


e a a 


D N 2 2 A —- 
(si, VOD) 
rn m 


pero ahora se distribuye T(v) donde: 
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Ejemplo 4.21. Se toman muestras del tejido encefálico en las autop- 
sias de neuróticos y esquizofrénicos, para determinar la existencia 
de un daño genético. Este es medido por una variable que toma 
valores en el intervalo (1, 10). Se acepta la normalidad y se obtienen 
los resultados siguientes: 


TABLA 4.7. 
Daño genético del tejido encefálico de dos grupos 
con problemas psíquicos 


src Oo 
irc ROO EEE EE 


Diga si son iguales las esperanzas de esa variable con a = 0,05. 
Solución 


Como sí =0,0457 y S?=0,00057 


2 
F= dx A 8,02 
Si? 0,00057 
de F(095 9  9)=3,18aceptando que  0%x%0; 
Entonces: 
Bl __ 6,997 6,991 -1935 
Mc 0, AS, o, 1 
y: ] 
se, A 0,0457 | 0,00057 
= — aci mot Sl - 22535 
e 0,0457 e 0,00( 00057* 
n- a -1 
m 


por lo que, T(0,95 v) = 1,96 y aceptamos que u,= |, 
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4.4.4. Otros casos 
4.4.4.1. Comparación de dos proporciones 


Cuando nos interesamos en comparar dos proporciones, como debe- . 
mos asumir que los tamaños de muestra son grandes, no es necesario 
considerar si las varianzas son iguales o no, pues: 
PP) 
p1—-p,) 8 p,(1-p,) 
n m 


T, 


Dip) 


sigue una distribución N(0,1). Por tanto, utilizamos las pruebas desa- 
rrolladas para T*. 


Ejemplo 4.22. Un tour alrededor de las obras de Gaudí en Barcelona es 
valorado. Después de realizarlo, se tomó una muestra de 100 alemanes ' 
y de 100 norteamericanos, entre los que le realizaron. Ellos respondían 
si repetirían con agrado este recorrido. El 80 % de los alemanes dijeron 
que sí y el 67 % de los americanos dieron la misma respuesta. ¿Es más 
agradable este para los alemanes que para los norteamericanos con 
una confiabilidad de 0,01? 

Solución 

Obtuvimos: 


p, = 0,80 y p,= 0,67 por lo que: 


_080-0,67___013_, ¡667 


É = z-———= 
2 10,8-0,2 ,0,67:0,33 0,06 
| 100 100 


se desea establecer si H,: 1, > L, . Entonces se acepta H, pues: 


S,= Eso, Zoo |= Loo, 2,331 


4.4.4.2. Comparación de |:, — |:, con un valor A distinto de cero 


En ocasiones el interés se asocia en establecer si una cierta relación 
une a, - u, y Un valor prefijado A. En los problemas analizados en este 
capítulo- se trata el más usual: asumir que esta diferencia es cero. 
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Si nos interesa establecer la verosimilitud de un cierto valor A, , pode- 
mos situar este valor en el numerador de los estadígrafos de prueba 
desarrollados y hacer las pruebas usuales sustituyendo O por A. 


Ejemplo 4.23. El editor de una serie de novelas románticas cree 
que el nivel de ventas de estas entre las mujeres supera en un 3,4 % 
el de los hombres. Se hace una encuesta entre 50 hombres y 50 
mujeres, y se obtuvo que el por ciento promedio obtenido fue de 
5,6 y 12,7 con varianzas de 14,3 y 12,8. ¿Se puede aceptar esta 
hipótesis con a. = 0,05? 


Solución 
(X-Y)+A_ D+A 
a 2 2 [A — 
Só o, 


n m 


y como H,: 1, <A vs Hp, >A 
De los resultados obtenemos: 


(12,7- 5,6) + 3,4 3,7 


as 


pe, = 


y H, es aceptada. 


4.4.5. Uso de paquetes estadísticos 


Los paquetes estadísticos toman, en general, computan el caso en 
que se usa la varianza ponderada S,. En Minitab, el comando POOLED T 
es utilizado con este fin. 


Ejemplo 4.24. Se toma una muestra de la producción de dos líneas 
que producen barras de acero. Se mide la diferencia entre la dureza de 
ellas y la esperada, dadas las normas técnicas. Los resultados fueron 
4, 6, 2, 7 para una y 7, 9, 5 para la otra. Diga si did afirmarse que son 
iguales las diferencias promedio. 


Solución 
La Tabla 4.8 da la salida para POOLEDT 95%. 
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TABLA 4.8. 
Salida de MINITAB para comparar las medias de dos líneas de producción 
de barras de acero 


FOR Cl 
CU as [si setas 


a a 


E 


Por lo que no rechazamos la igualdad. 


Ejercicios 


1. Se sabe que la eficiencia de un auto en términos de km recorridos 
por litro, sigue una distribución normal con varianza 9. Se toma una 
muestra de 70 autos de una nueva línea Meteor, pues el consejo 
presidencial de la firma quiere saber si esta supera la eficiencia de 
sus equivalentes en precio y potencia para los competidores que 
presentan un promedio de 15 km por litro. ¿Qué dice Ud. si el pro- 
medio fue de 14,58 ? 


2. Con el objetivo de evaluar el uso de los nuevos factores tecnológicos: 
y organizacionales en empresas de construcción de maquinarias, se 
toma una muestra de 20 industrias. La auditoría tecnológica efectua- 
da produce una calificación entre O y 100, considerada normal con 
varianza 225. En la encuesta se obtuvo un promedio de 64,4561. Diga 
si acepta que la media de las industrias es igual a 70 con a = 0,01. 


3. Interdecor hace un análisis de una nueva línea de cortinas, que su- 
ponen cambien el ambiente de las salas de estar. Los nuevos colori- 
dos y herrajes permiten enmarcar mejor ventanas de medio punto, 
pero se encarece el precio promedio de 300 $ por ventana. Se cree 
que las nuevas familias aceptarán el aumento, a partir de la publici- 
dad que se ha hecho y las ofertas de asesoría gratuita. Ellos consi- 
deran la normalidad del precio que aceptan pagar los posibles clien- 

tes y que la varianza es de 576. Se toma una muestra de 25 recién 
casados y se obtiene que ellos aceptarían un promedio de 310 $ 
por ventana. ¿Es aceptable la hipótesis con a. = 0,05? 
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4. Un observador toma una muestra de 25 días aleatoriamente y mide 
el tiempo utilizado por el Chief Yeoman Warder de la Torre de Lon- 
dres en su periplo diario para echar el cerrojo al portal exterior y 
llevar a cabo la llamada ceremonia de las llaves. Asume que la dura- 
ción en minutos de esa primera acción tiene una media de 8 y una 
varianza de 0,2559. En sus observaciones la media fue de 8,09. ¿Es 
válida su hipótesis con a. = 0,10? 


5. La teoría arquitectónica del p'ungsu, muy popular en Corea en el 
siglo Xiv se basa en los principios del ying y el yang y de los Cinco 
Elementos. La buena fortuna de las residencias dependerán, en gran 
medida, de acuerdo a ella, de la ubicación (sus puertas Norte y Sur, 
su relación respecto a “la tierra centro”, etc.). Se toma una muestra 
aleatoria de 18 residencias y se evalúa cuán efectivos fueron los 
arquitectos de una ciudad coreana en hacer casas “irradiadoras de 
energía”. Aceptando que el índice determinado es una variable nor- 
mal con desviación 5, y si la media fue de 7,8, diga si aceptamos 
que las residencias de esa época promediaban un índice menor que 
el 10, asignado al palacio Kyongbok, usando a = 0,05. 


6. El precio que aceptan pagar por día en una excursión en un cruce- 
ro por el Caribe es estudiado. Se toma una muestra de 100 usua- 
rios de una agencia de viajes y se le pregunta haciendo una oferta 

. de todo incluido en un crucero de 15 días. Se espera que ellos 
esperen que sea menos de 20,00 USD con una desviación de 8,00. 
¿Acepta Ud. esta hipótesis si la media es de 16,80, la normalidad 
es asumida y se usa a = 0,10? 


7. Una crema reductora de la grasa en los muslos es producida utili- 
zando diversos compuestos antialérgicos y productos naturales. Se 
realizan pruebas en una muestra de 9 mujeres, las que obtienen una 
rebaja promedio de 11,3 mm de circunferencia en 6 meses. ¿Si se 
dice que es efectiva cuando la rebaja de más de 10 mm es acepta- 
da, usando la normalidad y que la desviación es 3? 


8. Una enfermedad viral afecta la capacidad de respuesta auditiva 
aun después de diez días de recuperación. Se utiliza un test para 
establecer si esto tiene un origen psíquico. Una muestra de 500 
afectados es tomada aleatoriamente y se obtiene que la califica- 
ción de una prueba física tiene 73,45 puntos como promedio y 
una varianza de 203,77. ¿Puede afirmarse que el promedio de esa 
Variable es igual a 75? Use a = 0,01. 
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9: 


10. 


11. 


12. 


Una transnacional valora si el uso de una nueva tecnología 
computarizada le daría ingresos por más de 229 millones de USD 
en 5 años. Se hacen varias pruebas en una fábrica prototipo y se 
obtiene que con los resultados obtenidos en 75 escenarios, selec- 
cionados aleatoriamente, las ganancias medias serían de 226,7 
millones USD con una varianza de 224,97. ¿Recomienda la nueva 
tecnología si se acepta equivocarse con una probabilidad de 0,05? 


En el curso anterior, no menos de un 90% de los estudiantes de 
una universidad utilizan más de 1 hora en viaje de su residencia al 
centro. Se va a promover una opción cooperativa de transporte 
para aliviar esa carga extradocente. Se tomará una muestra de 
100 estudiantes para valorar esta iniciativa. 


A) Establezca la hipótesis de que la actual proporción no es menor 
que la anterior. 


B) ¿Cuál es la probabilidad de que en la muestra haya menos del 
90 % en esa situación? 


C) Con esos resultados aceptaría Ud. la hipótesis fijada en A? 


Los niños afectados por afecciones tiroideas pueden incrementar 
su estatura usando una hormona extraída de la escherichia coli. 
Los médicos esperan que el incremento en la estatura promediará 
más de 5 cm. y que la desviación es de 2,5 cm. En una muestra de 
16 pacientes se obtuvo un incremento medio de 5,8. ¿Es acepta- 
ble esa hipótesis con a = 0,01? 


Los lectores de un periódico están de acuerdo con la política que 
este sustenta, si más del 90 % de las veces los lectores manifiestan 
su apoyo. Se tomá una muestra de 50 artistas y se les da a leer 


- durante 6 meses la página cultural. Ellos promedian un 84,3 % con 


13. 


14. 


una desviación de 35,8. ¿Están ellos identificados con la política 
cultural que sostiene la publicación? 


Hay protestas por el tiempo que demora obtener un visado en Ru- 
sia para visitar países del occidente. Se plantea que esto toma más 
de 5 meses con una varianza de 9. Se toma una muestra de 66 
solicitantes y se obtiene que la espera fue de 6,8 meses. ¿Es válida 
esta aseveración? 


La probabilidad de éxito de una mujer en un puesto de dirigencia 
central en una empresa se dice es del 0,6 si estas tienen educación 
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15. 


16. 


17. 


18. 


superior. Se toma una muestra de 200, entre las mujeres uni- 
versitarias que son promovidas en un año. Estas son 
monitoreadas y se obtiene que, al pasar 2 años, fueron promo- 
vidas 98 y demovidas 60. 


A) ¿Es válida la afirmación hecha con a. = 0,05? 


B) Si la literatura sobre Relaciones Industriales establece que un por 
ciento mayor del 20 de demociones implica una mala selección 
en los promovidos, diga qué opina de las decisiones realizadas. 


Un baloncestista será contratado de acuerdo con su solicitud si 
este totaliza no menos del 20 % de las canastas de su equipo. El 
dueño contrata a un estadístico, el que asume la normalidad de 
estos porcentajes y selecciona una muestra de 100 juegos en su 
carrera. Se computó una media de 21 % con una varianza de 16,23. 
¿Cree Ud. aceptable recomendar que sea contratado? 


El promotor de un grupo musical dice que 3 de cada 10 jóvenes 
gustan de este. Toma una muestra entre los asistentes a un con- 
cierto y obtiene que de los 150 entrevistados 100 dijeron que sí. 


A) ¿Sobre qué población se hace las inferencias? 
B) ¿Aceptamos la hipótesis del promotor? 
C) ¿Cómo sugiere hacer la investigación? 


Se toma una muestra de 64 matrimonios en Sudáfrica, para esta- 
blecer si la lobola (dote de la novia) es como promedio superior a 
un equivalente -a 300 DM con una desviación de 25. La media 
muestral fue de 310 DM. ¿Qué diría Ud.? 


Se introduce propaganda sobre el sistema Opest para resolver pro- 
blemas de Optimización, que incluyen los que más comúnmente 
aparecen en las aplicaciones a estudios de portafolios, y otros, de 
matemática financiera. Se analiza su velocidad para resolver pro- 
blemas con más de 300 variables y 500 restricciones. Los resulta- 
dos, ante una muestra de 20 escenarios, son estudiados por la 
consultoría económica BAA. Los resultados obtenidos son usado . 
para establecer si las soluciones toman menos de 2,5 minutos en 
ser resueltas. Se comprará este sistema si esa hipótesis es válida, 
pues lo es para a. = 0,01. 


Los resultados fueron los que aparecen en al Tabla 4.9. 
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20. 


21. 


22. 


23. 


TABLA 4.9. 


Momeoa de resolución de problemas de optimización para las finanzas 


apa ae paa 


19. 


Un grupo de opinión en una organización científica dice que el 90 % 
de los miembros les apoya. Se toma una muestra de 60 afiliados y 
se observa que esto es cierto para 56 de ellos. ¿Es válida la aseve- 
ración? 


Después de hallar la espada con que logran vencer a los oposito- 
res de las Hordas de Ulmnis, se dice que es la famosa espada 
Contrinussis del héroe Namrid. Se desea probar al pueblo que esta 
es mágica, pues atraviesa las cotas de malla de los tungenos, ta- - 
mosos brujos de allende las montañas sagradas de Furng, tras 3 
estocadas. Triguch, el sabio selecciona una muestra de 100 cotas, 
y un destacado guerrero da fuertes cortes a cada una hasta atrave- 
sarlas. Esto logra con un promedio de 3,1 estocadas con una 
varianza de 0,49. ¿Apoyará Ud. que es Contrinussis, con a. = 0,05? 


Se dice que las francesas consumen el 57 % de sus calorías antes 
de las 14:00. Esto soporta el que sean esbeltas. Una muestra de 50 
mujeres es seleccionada en Cuba y se obtiene que como prome- 
dio ellas consumen sólo 45,3 % antes de esa hora. ¿Puede justifi- 
carse sus redondeces a este hábito? 


Se hace una investigación para establecer si más del 75 % de los 
ciudadanos apoyan que se haga una ley que autorice el suicidio 
asistido para personas en estado terminal. Esta es llevada a cabo 
entre adultos mayores de 21 años. Se seleccionaron aleatoriamente 
1 500 y 1 082 la apoyan. 


En la misa celebrada el 12 de Marzo del 2 000 en el Vaticano co- 
menzó la Jornada del Perdón” donde el Papa reconoció que la 
Iglesia Católica había dado pie a actos violentos en la historia y 
pidió perdón. Una encuesta fue desarrollada con el objetivo de inda- 
gar si a partir de este gesto se culpaba a la Iglesia como institución, 
o alos católicos que desarrollaron los actos, la responsabilidad histó- 
rica. Se tomó una muestra de 25 000 personas y se obtuvo que 
18 753 opinaron que estas se debían a los actores circunstanciales. 
Puede esperarse que más del 90 % tiene esta opinión. 
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24. 


25. 


26. 


27. 


28. 


29. 


Una compañía aérea tiene la iniciativa de ofertar, junto con el ticket, 
la opción de comprar un bono para la reforestación de los países 
pobres sobre por los cuales vuela, haciendo una rebaja sobre el 
precio del libro. Toma una muestra de 50 000 pasajeros de los que 
usan habitualmente su servicio y el 77,35 % de ellos muestran su 
apoyo. ¿Puede decirse que uno de cada 4 pasajeros lo hace? ¿Qué 
cifra propondría Ud. divulgar y cómo soportaría la publicidad? 


Se toma una muestra de hobbits y se obtiene que el 5,3 % de ellos 
tienen genes de elfos. Se hace una encuesta similar entre los 
gnomos y ei resultado fue de 3,10. ¿Podemos decir que ambos 
pueblos tienen el mismo nivel de cruzamiento con los elfos si las 
muestras fueron de tamaño 150 y 130 respectivamente? 


La existencia de un rumor sobre la conducta impropia afecta su 
imagen pública. Se ha diseminado en una empresa que el direc- 
tor de personal ha tratado de obtener 'regalías' por la promo- 


-ción de empleados no bien capacitados. Se toma una muestra 


de 150 empleados y 200 obreros indagándose sobre su valora- 
ción. 120 de entre los primeros revaloran la imagen de ese eje- 
cutivo y 132 entre los obreros. ¿Son más susceptibles de acep- 
tar los rumores los empleados? 


Un análisis de la inteligencia natural de los miembros de minorías 
es desarrollada. Una muestra de 10 Yawapitis es seleccionada en 
el Parque Nacional de Xingu y se le aplica una prueba especial- 
mente diseñada, que establecería un coeficiente de inteligencia. 
Se acepta la normalidad con una media de 120 y una desviación 
de 20. En la muestra el promedio fue de 108,2. ¿Acepta que 120 es 
la media para esta población con a = 0,05? 


Una investigación establece que el agua de Jave! al 12% es un desin- 
fectante poderoso y que elimina las bacteria del agua en un prome- 
dio de 30 segundos. Se realiza un experimento tomando 20 litros 
de agua contaminada y se obtuvo que, como promedio, se elimi- 
naba en 35,8 segundos. Diga si apoya la afirmación hecha por la 
investigación, si acepta la normalidad y que la varianza es de 25. 


Se dice que 2 de cada 10 personas prefieren tomar una bebida 
refrescante de cola al llegar a la casa. Se toma una muestra de 400 
en una barriada y se obtuvo que 72 estaban de acugrdo y lo to- 
marían. ¿Afirma Ud. que la aseveración es válid LR 


pops 
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30. La población de lobos grises estaba en etapa de extinción en una 


31. 


región. Una política de reintroducción elevó su número. Los gran- 

'jeros muestran su preocupación por ello. Una campaña es llevada 
a cabo para informar de la importancia de tal política. Al hacer una 
encuesta entre 250 campesinos, se obtuvo que 126 comprendie- : 
ron la justeza de repoblar la zona con lobos. Un político valora 
utilizar en su programa el sostener esta política si más del 50 % de 
los granjeros la apoyan. ¿Qué le recomendaría Ud.? 


Setenta de los 250 camellos clonados fueron rojos y con 7 molares. 
¿Puede decirse que el 30 % de los clonados tendrán esa propiedad? 


32. El tiempo transcurrido entre el suministro de un aerosol de Salbutamol 


y el comienzo de taquicardias fue medido entre 10 pacientes con 
edades entre los 18 y los 40 años seleccionados aleatoriamente. El 
tiempo medio en minutos fue de 1,2398 y la desviación de 1,4507. 
¿Puede decirse que este tratamiento provoca taquicardias? 


33. Un complejo hotelero hace una investigación de mercado para ha- 


cer la compra de almohadas, cubrecamas, cubiertas de sofáes y 
butacones. Seleccione 9 suministradores aleatoriamente y promedie 
el precio por unidad obteniendo: 


Objeto Almohadas Cubrecamas Cubresofáes Cubrebutacones 


Diga si acepta que la esperanza del costo por cada una de ellas es. 
mayor que 35, 75, 100 y 65 respectivamente, utilizando a = 0,10. 


34. En una población de mujeres con hábitos de promiscuidad, se 


evalúa el por ciento de contactos sexuales con protección. Se se- 
leccionan 6 al azar y se obtiene que estos fueron: 10,12; 6,32; 7,39; 
11,87; 5,67; 11,37. 


¿Puede decirse que en el 10 % de los contactados se protegieron? : 
Use a = 0,01. 


35. Un empresario espera que la publicidad hecha a su nueva línea de fragan- 


cia aumente sus ventas mensuales hasta 46 000 USD. Este toma una 
muestra de 60 expertos de mercado y le solicita su opinión, así y se obtie- 
ne que ellos le asignaría como promedio 45 000 USD con una desviación 
de 3070,23. ¿Estas opiniones soportan su hipótesis para a. = 0,05? 
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37. 


38. 


- 39, 


40. 


41. 


42. 


Se analiza una muestra de juicios dados por típicos, en que se 
utiliza el principio de que la Sharía (derecho canónico islámico) pri- 
ma sobre los universales. El orden en que estos entran en contra- 
dicción es evaluado utilizando una calificación entre O y 500. El 
fenómeno se considera modelable por una variable normal y los 
resultados fueron en una muestra aleatoria: 199 184 94 500 424 
31 75 456 92 70 472 469. ¿Puede decirse que se espera una 
calificación de menos de 350? Use a = 0,01. 


El tiempo que debe permanecer como inventario ocioso una máqui- 
na herramienta en una empresa metalúrgica es fijado en 9 meses, si . 
esta hace un manejo adecuado de sus recursos. En una inspección 
se obtuvo que las 5 máquinas muestreadas en el almacén llevaban 
un promedio de 11,3 con una desviación de 2,78. ¿Es adecuado el 
manejo que hace de sus recursos esta empresa? Use a = 0,01. 


Una convención sobre Comercio Equitativo quiere fijar las tasas 
que deben fijar para proteger a los pequeños productores. Hacien- 
do la labor de lobby, un grupo consultor entrevista a 9 delegados y 
obtiene que ellos aceptarían tasas de 3,5 3,6 3,7 3,8 3,8 4,0 
4,0 4,0 y 4,5. ¿Cree que la propuesta de una tasa media esperada 
de 4, será una propuesta aceptable con a. = 0,05? 


Un ejecutivo desea establecer el nivel de aceptación que tiene su 
estilo de dirección entre sus subordinados. Encarga a una empre- 
sa hacer una investigación que le permitiera, entre otras 
interrogantes, dar respuesta a esta. El psicólogo incluyó una serie 
de preguntas cuya calificación daba un valor entre 10 y 50 a la 
valoración que hacía de la política de dirección de este. Se valora 
esta como centralizada y despótica si el promedio es mayor que 
40. En la muestra de 12 empleados obtuvo que el promedio fue de 
42,3 y la desviación de 1,7. ¿Estas respuestas dan una visión de 
un ejecutivo tiránico? Use a = 0,01. 


Los teatros, al representar una ópera, ocupan el 87 % de los asientos 
al hacerse una encuesta en una muestra de 10. Aceptando la norma- 
lidad y tras computar la varianza que fue de 8,35, diga si puede 
afirmarse que la asistencia es menor que el 90 %, con a = 0,05. 


Se hace oferta por catálogo de ropa de playa usando el nuevo 
sitio web de una Agencia turística. El precio es reducido, si se acepta 
un paquete turístico basado en hacer un crucero por el Pací- 
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43. 


44. 


45. 


46. 


fico. El incremento en las ventas en una muestra de 10 semanas 
fueron: 194 195 196 198 199 199 199 199 201 205. ¿Aceptaría 
Ud. que hay un incremento de más del 195 % con a = 0,01? 


Un nuevo antibiótico es usado para combatir la amigdalitis. El tiem- 
po en que desaparecen los síntomas es promediado en una mues- 
tra aleatoria de 27 niños. En esta se obtuvo que la media tue de 
3,41 días con una desviación de 0,84. ¿Puede decirse que se dis- 
minuyó en un 10 % el tiempo promediado por los antibióticos tradi- 
cionales, que era de 6,8 días? Use a = 0,01. 


Un lanzador jugador profesional de pelota debe promediar veloci- 
dades de más de 85 millas por hora, para ser valorado como un 
eficiente relevo en. Grandes Ligas. Un novato es analizado y los 
resultados, en una muestra aleatoria de sus lanzamientos, fueron: 
81,2 90,3 94,6 76,5 88,3 875 67,4 63,2 75,4. ¿Cree Ud. que será 
aceptado si a = 0,1? 


Un turista se entretiene en cronometrar el tiempo que utilizan en el 
cambio de guardias de la fortaleza del Morro en Ciudad de La Ha- 
bana. Visita aleatoriamente 12 veces esa instalación y obtiene que 
esta dura como promedio 66,3 minutos, con una desviación típica 
de 8,397. ¿Puede aceptar que la duración esperada es mayor de 
una hora, con a = 0,05? 


Se estudian los avances sobre el uso de la tecnología solar en la 
urbanización. Una muestra de casas es tomada y se evalúa el aho- 
rro asociado a residencias que utilizan energía solar. Se desea sa- 
ber si estas generan 500 kilovatios-hora. Se tomaron muestras de: 


C1= Consumo por encima de los 500 kv/h en Construcciones 
ecológicas. 


(2 = Consumo por encima de los 500 kv/h en Casa de bajo con- 


sumo. 
C3 = Consumo por encima de los 500 kv/h en Casas Pasivas. 


C4 = Consumo por encima de los 500 kv/h en Casas de cero- 
energía. 


Los resultados aparecen en la Tabla 4.10 con la salida de Minitab 
correspondiente. 
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TABLA 4.10. 
Salida de Minitab para estudio de consumo energético 


0,00 C1;C5 


MTB>Test 


47. 


48. 


49. 


Alternative 
SUBC> 


| og16 | 816 1592 921 0, KUN 


Analice el problema planteado. 


Una cadena de cines estudia si tas nuevas ofertas de servicios 
integrados en la modalidad Multicinema dentro de una Plaza con 
diversos servicios atraen a los jóvenes. Toma una muestra de 64 
adolescentes dentro de la Plaza en una semana y les aplica un 
cuestionario, cuya calificación da una evaluación del uso que ellos 
harían de esa oferta. Se obtiene que estos promedian 52,85 pun- 
tos dentro de una escala con un máximo de 100. La desviación 
típica tue de 4,51. ¿Es aceptable decir que la preferencia es mayor 
de 50 puntos? Use a = 0,05. 


Una nueva vacuna contra la tuberculosis es desarrollada tomando 
en cuenta el hecho de que hay una nueva cepa resistente a los 
antibióticos. La nueva vacuna induce la producción, por parte del 
sistema inmunológica, de una sustancia que le elimina. Se hacen 
100 pruebas gn una muestra de esos pacientes. Se observa en las 
pruebas invitro que la bacteria es eliminada en un promedio de 
4,52 días con una varianza de 2,81. ¿Considera que es aceptable 


decir que puede esperarse que el tiempo que demoraría crear los 


anticuerpos y eliminar la infección es menor de 5 días? 


Un egiptólogo analiza la dinastía de Omeya y encuentra vasijas en , 
un asentamiento. Se considera que la familia vivió en esa época si la 
diferencia de la edad de ellas, medida con los procedimientos más 
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avanzados, no promedia más de 200 años. En la muestra enviada 
al laboratorio se obtuvieron como resultados: 180, 184, 175, 207, 
190, 210, 214 ,197, 192,196. ¿Acepta que no son de esa época? 


50. Al hacerse una inspección se acordó que el resultado de la auditoría 


51. 


52. 


53. 


54. 


55. 


será considerado bueno, si el promedio de las Dollar-Tainted-Units 
de las distintas dependencias es menor que 1,6. Se considera que 
estas medidas son normales bajo condiciones de adecuado control. 
En la muestra aleatoria de dependencias se obtuvo: 0,5 2,7 3,4 0,01 
0,5 0,41,3 0,9 1,9 2,6. ¿Será buena la calificación con a = 0,05? 


Se hace la publicidad de que un programa de adelgazamiento, 
que combina una dieta en base a vegetales y proteínas con ejerci- 
cios del Yoga tradicional, logra rebajar 3 kilos en dos meses. Los 
resultados, en kilogramos de rebaja en dos meses, fueron en una 
muestra de mujeres obesas: 


45 -14 24 23 78 -02 58 0/2 15 2,3 -0,4 -18. 


¿Asumiendo la normalidad, puede aceptarse que se rebaja lo 
publicitado con a. = 0,10? 


El por ciento de accidentes con víctimas fatales en una ciudad fue, 
durante el pasado año, de 12,3. En una muestra tomada de 28 
accidentes ocurridos en el primer semestre de esta año este fue de 
16,8 con una varianza de 23,95. ¿Ha aumentado el porcentaje de 
estos hechos? Use a = 0,05. 


Una investigación teórica establece que el crecimiento de las células 
nerviosas se desarrolla en los simios reemplazándose más del 1 % 
de ellas. Para corroborrarle, se toma una muestra de 7 monos y se 
obtiene que el promedio obtenido es del 1,3 % con una desviación 
del 0,217 %. ¿Es aceptable la hipótesis formulada teóricamente? 


Una revista de interés general estudia el uso que de ella hacen sus 
lectores. Selecciónase una muestra de 20 lectores y se obtiene 
que cada ejemplar es leído por un promedio de 3,52 personas con 
una varianza de 2,92. ¿Puede decirse que más de 3 personas leen 
cada ejemplar con a. = 0,05? 


La mantequilla de cabra es elaborada por una pequeña procesadora. La 
fórmula utiliza 113 g de mantequilla y de queso de cabra, y una 
cucharadita de eneldo, perejil y cebollino. La nueva mantequilla cuaja al 
cabo de un promedio de 2 horas y se supone que la varianza sea de 
una hora. Un competidor elimina el eneldo y la varianza obtenida en una 
muestra de 11 intentos fue de 0,84. Puede argúir que el nuevo procedi- 
miento tiene una menor varianza de tiempo de cuaje? Use a; = 0,05. 
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56. 


57. 


58. 


59. 


60. 


61. 


62. 


Se analiza la impermeabilización obtenida al desarrollar un mate- 
rial que combina desechos de neumáticos y suelo artificial para 
hacer un tipo de asfalto. Los resultados de esta posee una varianza 
de 15,83 en una muestra de 35 sitios seleccionados al azar en una 
carretera después de 5 años de aplicar este material. ¿Puede decir- 
se que la desviación típica es menor que 3? 


Los envases de arroz precocido, embalados para la exportación, 
deben cumplir con normas de peso, entre las que se encuentra 
que la desviación de cada lote sea igual a 1,5 gm. Se toma una 
muestra de 9 paquetes en un lote y se obtiene que la varianza 
muestral fue de 5,48. ¿Cumple con tener el lote la desviación 
normada con a = 0,1? 


Un grupo ecológico estudia las manadas de órices blancos desarro- 
lladas en un parque nacional africano, a partir de especies en cauti- 
verio. Se analiza la variabilidad de su peso en una muestra aleatoria 
de 7. Diga si acepta que la varianza es menor de 240 si S?=231,64. 


Se dice que el índice de diversidad de la flora en las montañas es 
mayor de 23,85. Tomando esta como una desviación típica, se quiere 
establecer si esto es cierto. Una muestra de 96 sitios son tomados 
aleatoriamente en la zona subtropical y se obtiene que la varianza 
fue 635,05. ¿Lo acepta? 


Se toma una muestra de 25 editores, los que son encuestados 
para calificar la obra de William Faulkner respecto a la de Ernest J. 
Gaines, en términos de su regionalismo literario. Se utilizan 
Autobiography of Miss Jane Pitman y A Lesson before Dying como 
novelas base para ello. Cada uno da la calificación y computamos 
las diferencias. Diga si puede decir que las medias son iguales si 
los resultados arrojaron que d = - 25,83 y la desviación computada 
fue de 18,77 y si acepta la normalidad. 


Se toman 6 compradores habituales de CD's de música salsa y se- 
les hace una oferta de servicio personalizado que pone a su dis- 
posición las nuevas producciones. Se obtuvo que la diferencia 
entre las compras totales de CD's, antes de la oferta y después, fue 
de 18. ¿Hay una mejoría significativa si a = 0,05? 


Se analiza la aceptación de los servicios de un enclave turístico en 
los dos miembros de 6 parejas. Las respuestas se evaluaron en un 
intervalo [0,20]. Estos fueron tabulados en la Tabla 4.11. 
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TABLA 4.11. 
Valoración de los servicios de un enclave 


a) ¿Difieren significativamente las valoraciones promedio? 
b) Justifique por qué el uso de muestras pareadas es el adecuado. 
R/ a) Acepto la igualdad. 


b) El método permite asegurar la independencia reflejable, por 
la misma causa de variación en la valoración de la pareja. 


63. Una cadena de “Fast Food” analiza la aceptación de una nueva oferta, 
en la que se incrementa la ración de patatas fritas en relación a la ante- 
rior, respecto a otra en la que la carne es de mejor calidad. Se seleccio- 
nan aleatoriamente comensales habituales y se les da gratuitamente las 
dos ofertas, se les pide que las valoren en una escala del 0 al 20. Los 
resultados dados a las dos ofertas aparecen en la Tabla 4.12. 


TABLA 4.12. 
Aceptación de la nueva oferta en la cadena Fast Food 


MG 18,45] 10,23 17,63 | 20,00 | 13,72 12 ESE 
OOPS 10,351 12,271 15,87 17,82 


¿Prefieren la oferta usual significativamente? 


64. Un editor selecciona a 5 críticos, aleatoriamente, de su staff y les 
envía dos novelas escritas por el mismo novel autor. Les solicita 
una evaluación de su potencialidad de venta en una escala del O 
al 50. Se obtuvieron los reportes que están en la Tabla 4.13. 


TABLA 4.13. 


Potencialidad de venta de dos novelas 


Revisor 
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65. 


Si se considera que posee una mayor potencialidad la primera nove- 
la, esta será publicada primero. ¿Lo recomienda Ud., con a = 0,1? 


A partir de las declaraciones de la Cumbre de Río en 1992 y la 
Conferencia de Kioto de 1997, se desea hacer un protocolo que 
firmen las naciones con mayor aporte a los cambios climáticos 
globales. Una muestra de 40 funcionarios de alto rango en una. 
nación es tomada. Se evalúa la diferencia en la valoración he- 
cha por ellos en ambas, al apoyar la aprobación de 5 principios. 
Se desea establecer si estas fueron significativamente positivas 
al 90 %. Los resultados parciales aparecen en un la Tabla 4.14 
con las salidas del Minitab. 


TABLA 4.14. 
Resultados de la encuesta de funcionarios 


0,90 C1;C5 


MTB>Test 


Alternati 
SUBC> PS 
MU=0,900 


TEST OF VS 


o e | o JA 
ICI ACI CA CE IC A 


66. 


Complete la tabla y dé su respuesta. 


Un estudio sobre las diferencias en la caligrafía es comenzada 
tomando el califato de abasí al-Mamun (786-833) y terminando con 
el Hafe Othmanse. Este se basa en la selección de una muestra de 
escritos de poesía y tratados. Dos expertos calígrafos, uno árabe 
y otro europeo, analizaron una muestra de 126 documentos y se 
obtuvo que las diferencias en las notas asignadas a cada docu-- 
mento están en la Tabla 4.15. 
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TABLA 4.15. 
Valoración de la caligrafía de documentos escritos en árabe 


Cualidad 


Hexibilidad 12,84 24,67 


Simplicidad 13,72 32,73 
Pureza -10,95 88,29 


¿Las valoraciones son iguales con a = 0,10? 


67. Un amigo de Dr. Jekyll le ayuda en sus investigaciones y toma 
una muestra de 10 veces en las que este toma el brebaje. Antes de 
hacerlo, le hace una prueba para establecer su coeficiente de mal- 
dad y esta es repetida cuando Mr. Hyde se presenta. Los resulta- 
dos fueron tabulados en la Tabla 4.16. 


TABLA 4.16. 
Maldad del Dr. Jekyll y Mr. Hyde 


Analizado Coeficiente de maldad computado 
11,2; 13,4; 17,5; 13,2; 26,7; 10,9; 15,7; 
9,2; 17,9; 12,8 


15,6; 12,8; 18,9; 14,2; 10,4; 11,8; 12,9; 
9,3; 15,6; 10,9 


Dr. Jekyll. 


- Mr. Hyde 


¿Diría Ud. que estos resultados del estudio del subconsciente de 
Dr. Jekyll y Mr. Hyde expresan que el segundo no es más que una 
expresión no autolimitada del primero? Use a = 0,01. 


68. Una cosmetóloga estudia el efecto de utilizar Áloe Vera o Tilo como 
humectantes. Toman muestra de tamaño 4 y 5 y le aplican trata- 
mientos para determinar si estos difieren significativamente al nivel 
a. = 0,01. Ella acepta que las varianzas respectivas son de 8 y 10. 
Si la ganancia en humedad de los rostros fueron 49,9 y 51,25 diga 
si considera que ambos tratamientos son equivalentes. 


69. Para estudiar el comportamiento de los factores técnicos y 
organizativos en empresas constructivas, se toma una muestra de 

. 40 proyectos de viales y 50 de emplazamientos hoteleros. Se con- 
sidera que la mediación entre estos factores es una variable nor- 
mal con desviaciones 25 y 23 respectivamente. En la encuesta se 
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70. 


Obtuvo que los promedios fueron 418,02 y 401,98. ¿Diría Ud. que 


ambos tipos de proyecto tienen la misma media de la mediaciór 
técnica-organización? Use a. = 0,05. 

En un estudio sobre los niveles de contaminación por desecho: 
del petróleo en el Oriente Medio se toma una muestra de 12 sitio: 
rurales y 20 urbanos, y se mide el por ciento de la población afec 
tada somáticamente. Se asume que la varianza en ellos es igual .. 
16,53. Si las medias obtenidas fueron de 24,04 y 34,58, diga si las 


- afectaciones pueden considerarse iguales con a, = 0,01. 


71. 


72. 


73. 


74. 


Se estudia el área foliar cubierta por especies autóctonas en el 
Sabah del monte Kinnabalu. Cien muestras son tomadas a la altura 
de 4 000 metros y otras 100 a los 1 000 metros de altura. Las medias 
obtenidas fueron 12,92 % y 11,39 % con varianzas de 8,35 y 7,64, 
respectivamente. ¿Es mayor el área cubierta a la mayor altura? 


En la Convención de Viena contra el Tráfico Ilícito de Drogas, de 
1988, se fijaron normativas para el combate internacional del mis- 
mo. Se tomó una muestra de 40 especialistas y se les solicitó 
evaluaran la efectividad real de la misma, a la luz de la experiencia 
acumulada. Ellos promediaron 56,74 puntos. Si se asume que esa 
calificación es una normal con media 70 y varianza 100, diga si 


acepta la hipótesis asociada a |. 


Los mismos encuestados del ejercicio anterior evalúan también la 
efectividad del Programa Mundial de Acción de 1990, y se obtuvo 
que el promedio de las diferencias obtenidas en la calificación de 
ambas legislaciones fue de -4,8 con una varianza de 97,62. ¿No 
hay diferencias entre las calificaciones con a. = 0,10? 


Se hace un estudio antropológico entre niños de los garinagu o 
caribes negros, habitantes de la costa de Belice, Honduras , Gua- 
temala y la población ajuka-saramaka de Suriname. Estos grupos 
provienen del cimarronaje desarrollado en época colonial. Se mide 
la estatura. Vea la Tabla 4.17. Analice los resultados y diga qué 
opina de la igualdad de las medias de estas medidas. 


TABLA 4.17. 
Salidas de Minitab del estudio entre antiguos cimarrones 
TwoSample | “ESTATURAI1” 
95,0 
Alternative 0 ESTATURA1 


TWOSAMPLE | ESTATURA1 


N STDEV 
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Tabla 4.17 (continuación) 


ESTATURA1 7,12 


ESTATURA2 4,44 
95. PETEl ESTATURA. 


TTEST MU (VS NE): 


T=3,69 
P=0,0017 
POOLED 

STDEV=3,15 


¿Qué diría Ud.? 


75. En los estudios de ADN se han establecido dos tipos de líneas de 
desarrollo de la genoterapia: la somática y la germinal. La primera 
se dedica a hacer alteraciones de las células del cuerpo del pacien- 
te y la segunda se hace una transmisión a las nuevas generacio- 
nes. Se analiza el problema ético envuelto y el clínico, en una mues- 
tra de 150 casos. Los resultados aparecen en la Tabla 4.18. 


TABLA 4.18. 
Análisis de la diferencia entre las calificaciones dadas a la solución genética 
de 160 casos, con una solución factible del factor hereditario presente 
en el ADN en términos éticos y clínicos 


Genoterapia Promedio de las diferencias 


Germinal -12,74 


¿Son iguales las calificaciones dadas en las distintas genoterapias? 


76. Un sensor especial es diseñado para establecer la estructura del 
cristalino y poder compensarle con unos lentes de contacto de 
tecnología de punta. Se selecciona una muestra de pacientes con 
problemas complejos y se hacen lentes de contacto con la nueva 
técnica y la usual. La diferencia media en 300 casos del índice de 
corrección fue de 0,452 y la desviación de 8,19. ¿Hay una ganan- 
cia significativa para el nuevo método? 


77. Una muestra de 64 turistas son llevados a Puerto La Cruz en Ve- 
nezuela y a Varadero en Cuba. Se les solicita evalúen, en ambos 
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enclaves turísticos en una escala del 1 al 10. Las diferencias indivi- 
duales son computadas y se obtiene que su promedio fue de 1,258 
con una varianza de 2,811. Evalúa la población que representan 
significativamente mejor a Varadero si a. = 0,01. 


78. Un estudio del barrio berlinés de Kreusberg se desarrolla para valo- 
rar, con dos puntos de vista su herencia cultural. Uno es el de his- 
toria del arte y el legado dejado, y otro, el de las transformaciones 
llevadas a cabo por los inmigrantes que le pueblan contemporá- 
neamente. Para ello se toma una muestra de 100 estudiantes del 
área de las Ciencias Sociales y se le plantea un trabajo de curso, 
donde valoren ambos aspectos. Un comité de especialistas califica 
ambas evaluaciones y su diferencia. La media de las diferencias 
fue de -34,861 y la desviación de 128,52. ¿Difieren estas? 


79. Se estudia la variación del peso total de la combinación “Prosciutto 

di Parma con melón” en el almuerzo y en la cena en el restaurante 

. Di Boyani. Se toman 23 muestras servidas en cada sesión y se 

obtuvieron varianzas de 112,7 y 84,8. ¿Son iguales las varianzas 
con a. = 0,05? 


80. La ausencia de un factor de coagulación en el hígado es la causa 
de la hemofilia. Esta se presenta en dos variantes, según el factor 
ausente. Se utiliza un retrovirus para darle solución. Se analizan 
dos técnicas y la variabilidad de la pureza de los resultados de 
estabilidad de este, al ser implantados en 12 hemofílicos aqueja- 
dos del tipo A y 30 del tipo B. Si las varianzas fueron 19,94 y 4,7, 
diga si cree que es más variable para la variante A. 


81. Dos procesos evaluativos se llevan a cabo, independientemente, 
entre dos grupos de aspirantes a plazas de bailarines de ballet. 
Una muestra es tomada en cada uno y se les aplica una batería de 
pruebas y que aparecen en la Tabla 4.19. Asuma que la distribu- 
ción de la calificación es normal y use a: = 0,05. 


TABLA 4.19. 
Efectividad del test de personalidad 


Tamaño de muestra Media ., Varianza 
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- 82. En un restaurante se experimenta con una oferta en la línea “Fast 

Food”. Se seleccionan aleatoriamente 5 ejecutivos y 13 emplea- 

dos que almuerzan en los alrededores. Los resultados del puntaje 
- dado a las dos ofertas fueron presentados en la Tabla 4. 20. 


TABLA 4.20. 
Puntaje de las ofertas de “Fast Food”. 


medias O 7 


Diga si acepta que empleados y ejecutivos dan la misma valora- 
ción promedio a la oferta con a = 0,01. 


84. Una tienda de víveres puede establecer una de dos políticas de 
itinerarios de los recorridos de entrega a los clientes. Toma dos 
muestras de pedidos y los asigna a cada una de ellas, para obser- 
var el tiempo en que se efectúa el ciclo de recogida entrega de los 
productos. Una muestra es de tamaño 10, en la que se obtuvo un 
promedio de 2,989 horas con una varianza de 0,252. En la otra se 
tomaron 8 pedidos y el promedio fue de 2,701 con varianza de 
0,489. Aceptando la normalidad, diga si acepta que ambas 
promedian el mismo tiempo, usando a = 0,05. 


85. Una muestra de 23 personas de menos de 30 años es selecciona- 
da y se le solicita una evaluación de una serie de 10 filmes clásicos 
de aventura filmados en los EE.UU.. Otra muestra es también se- 
leccionada entre personas de más de 40 años y les somete al mis- 
mo custionamiento. El interés del cineasta es establecer si existe 
una diferencia significativa en los criterios de ellos. La diferencia 
entre las dos muestras fue de 3,4 puntos y las varianzas computa- 
das fueron de 105,93 y 77,41. Acepte la normalidad y haga las 
pruebas de hipótesis necesarias. 


86. Una muestra es seleccionada en una aerolínea, en dos de sus des- 
tinos europeos. Se desea establecer si los criterios son iguales res- 
pecto al trato en el viaje. Se seleccionan 20 vuelos, aleatoriamente, 
y los resultados obtenidos aparecen en la Tabla 4.21: 
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TABLA 4.21. 
Valoración de la satisfacción del trato en el vuelo 


Media muestral 78,26 66,42 


Es igual la valoración del trato? Use a.=0,05. 


87. Se establecen sistemas de control en una biblioteca. Uno se apli- 
ca a los lectores habituales y otro a los ocasionales. El tiempo 
transcurrido entre el PIRSIamO y la entrega en ambos grupos está 
en la Tabla 4.22. 

TABLA 4.22. 
Resultado del control del préstamo 


Habituales 11,7 13,1 12,2 13,9 13,2 
Ocasionales 12,3 12,8 12,8 13,4 13,6 11,6 


¿Son iguales los tiempos promedios? 


88. Un programa de adelgazamiento, que combina una dieta sobre la base 
de frutas y vegetales, y proteínas con cantidades de carne blanca, esta- 
blece que hombres y mujeres logran rebajar la misma cantidad en las 
primeras 5 semanas. Se tomaron muestras entre pacientes aquejados 
de problemas cardiovasculares y se obtuvo la Tabla 4.23. 


TABLA 4.23. 
Resultados de un programa de adelgazamiento 


UM 2,3 -1,2 2,8 2,4 5,7 2,9 1,7 15 2,3 4,6 1,6 2,5 2,8 1,9 0,6 -0,9 


IT 06 25 35 02 04 1,2 05 26 3,0 -14 -04 2,3 16 36 4,5 -32 0,3 1,721 


Asumiendo la normalidad, ¿puede aceptarse que la hipótesis es- 
tablecida con a = 0,05? 


89. Se mide el alto de dos especies de eucaliptos, en una muestra de 
árboles talados existentes en un aserrío. Los resultados fueron que 
la especie uno promediaba 11,23 metros con una varianza de 11,8 
y en la otra, la media era de 8,92 y la varianza 34,2. Es igual.el alto 
promedio de los árboles aserrados, si considera la población en el 
aserradero, con a = 0,05 ? : 
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90. Se enviaron a dos empresas cuestionarios para valorar la relación cos- 
to-calidad del servicio telefónico celular ofertado a sus unidades móviles 
de instalación-reparación de equipos. Los resultados fueron, en las 
muestras de las unidades móviles, los que aparecen en la Tabla 4.24. 


E TABLA 4.24. 
Evaluación de la relación costo-calidad 


Empresa Tamaño de la muestra Media Desviación típica 


ñ 


ICON ION 


¿Es mejor la valoración de la Empresa B? 


91. Se hace una estudio de la novelística latinoamericana, entre escri-' 
tores europeos y latinoamericanos. Se les pregunta cómo clasifica- 
rían la obra de Alejo Carpentier, si como realismo mágico o como 
barroco. De los 50 europeos seleccionados aleatoriamente, 34 lo 
calificaron con el primer término. Por su parte, 75 de los 100 lati- 
noamericanos lo hicieron así. ¿Puede decirse que las proporcio- 
nes son iguales, con a. = 0,01? 


92. Se toman muestras de 85 y 92 bloques de hormigón en dos líneas . 
- de producción; en una empresa constructora de materiales se es- 
tudia su resistencia. Se obtuvo que la media fue de 15 toneladas 
por cm? y la desviación de 3,5 en la primera línea, y de 20 tonela- 
das por cm? y 8,2 de desviación en la segunda. ¿Ambas tienen el 
mismo comportamiento? 


93. Se hace un estudio sobre el desarrollo de respuestas positivas a 
un tratamiento del acné juvenil. Se tomaron muestras entre ado- 
lescentes de ambos sexos y se obtuvo que el 35,97 % de los 
varones tuvieron una respuesta positiva al cabo de 2 semanas y 
el 48,12 % de la hembras. Si ambas muestras fueron de 500 jóve- 
nes, diga si las hembras responden mejor que los varones, con 
una significación del 0,05. 


94. Se toma una muestra de personas neuróticas y otra de normales. 
Después de un cierto entrenamiento, se les da una base de datos 
que deben ordenar de acuerdo con las reglas dadas. La calificación 
es considerada normal y se obtuvieron los resultados de la Tabla 4.25. 
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TABLA 4.25. 
Ordenación hecha por neuróticos y normales 


E Neuróticos ; 85,1 72,3 63,1 90,5 80,2 


=-  Norniales Me 105,3 71,6 102,3 122,77 


¿Son iguales las calificaciones promedio con a = 0,01? 


95. Los habitantes de Elfóolandia dicen ser grandes lectores y que pue- 
den obtener toda la información en una página Web en un minuto. 
Se toman 175 aleatoriamente y se obtiene que la media fue de 0,92 
páginas, con una varianza de 1,53. ¿Es válida la aseveración de 
esta raza humanoide? 


96. La calificación de los aspirantes a conductor de coches de carrera 
lleva a su aceptación en 2 de cada 35 aspirantes. Se toma una 
muestra entre aspirantes a piloto de caza bombarderos y de 78 
aprobaron 17. ¿Tienen ellos la misma media que la de los otros 
aspirantes? Use a. = 0,05. 


97. Al arribar a los dos satélites del planeta Mirm los expedicionarios 
toman 600 muestras del suelo y obtienen que el por ciento de 
arabio en ellos fue de 0,07 y 0,045, respectivamente con varianzas 
de 0,83 y 2,73. Diga si recomienda a alguno, por tener un mayor 
por ciento de este material. 


98. Se toman ejemplos claves para evaluar un algoritmo genético en 2 gru- 
pos de problemas dados en dos páginas de internet. Los resultados, en 
términos de la velocidad de convergencia, son los de la Tabla 4.26. 


TABLA 4.26. 
Velocidad de convergencia de dos algoritmos genéticos 


UN 0 1. 2.3.4 5 6 7 89 10102 


34,9 78,7 89,5 79,1 85,3 78,5 86,1 96,5 56,4 78,6 97,9 74,3 94,7 


23,0 75,3 90,1 81,5 81,8 85,0 95,2 86,1 87,5 99,1 79,0 77,5 95,4 


¿Son iguales las velocidades promedia, si cada problema % y es 
considerado equivalente en términos de dificultad? 


99. La eritroblasis en recién nacido es tratada usando 2 posibles 
procesos de cambio de la sangre del bebé por un donante del 
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mismo tipo de sangre y con Rh-negativo. El tiempo necesa- 
rio para cambiarla fue medido en una muestra de 21 hospi- 
tales en proceso, y de 6 en el otro caso. Así se obtuvo la 
Tabla 4.27. 


TABLA 4.27. 
Resultados del estudio de eritroblasis 


Proceso 


Diga si los dos procesos son similares, en términos de duración, 
con una significación del 0,01. 


100. Ocho adultos son seleccionados al azar entre los asistentes a un 
cine donde exhibían el filme Apachurrado sin misericordia, don- 
de la violencia es del corte dado en películas de gansters. A esos 
se les exhibe otro similar, La patada invencible, hecho en Asia y 
que es de Kong Fu. Ellos dan las siguientes calificaciones inclui- 
das en la Tabla 4.28. : 


TABLA 4.28. , 
Nivel de agresividad reportado 


Filme Coeficiente de agresividad ' 


Apachurrado sin misericordia 28 44 80 96 97 100 10 71. 
| "La patada invencible 36 40 78 15 6 11 21 34 


- Si acepta la normalidad, diga si les asignan mayor nivel de vio- 
lencia al filme de gansters, con a = 0,1. 


101. Se toma una muestra de 11 empresas para evaluar el cumplimien- 
to del plan de amortizar la deuda con el banco. Estas se dividen en 
dos tipos: producción y servicio. La deuda no amortizada tuvo un 

" promedio de 7 881 miles de dólares, en las de primer tipo con ' 
170,65 de varianza. Para las de servicio fue 5,758 la media y 110,08 
la varianza. ¿Tienen igual comportamiento estos grupos? 
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102. Dos cadenas de hoteles evalúan el nivel de ocupación de sus 
habitaciones mediante un muestreo de instalaciones en una se- 
mana. Se obtuvo la Tabla 4.29. 


TABLA 4.29. 
Por ciento de ocupación de las habitaciones en la muestras de dos cadenas 
de hoteles durante una semana 


CH 68,1 34,5 65,5 56,4 89,6 52,8 57,7 32,8 58,1 24,34 6,7 53143 9,5 
1 


CH 51,9 30,1 17,8 39,5 73,0 71,3 72,3 86,2 694 78,2 54,8 20,1 23,5 11,6 56,8 
2 3 


¿Es mayor la ocupación promedio de la cadena 2? 


103. El comportamiento de mellizos es estudiado. Se evalúa la me- 
moria olfativa de ellos, a través de una muestra de 10 parejas. 
Los mismos olores son incluidos en la prueba. Diga su opinión, 
si el resultado de la salida de un paquete de estadísticos es el 
«dado en la Tabla 4.30. 


TABLA 4.30. 
Análisis de los resultados del estudio de la memoria olfativa de mellizos 


apa] 
2,801 0,920 0,292 (2,1276, 3,474) a 
" 


S 


Sa 


VS MU 
a] 


SEMEA 
CONC A CA 
2,801 2,801 0,292 9,640 * 0,000. E 


0,000 
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104. Un estudio de la relación entre las alteraciones psíquicas y las 
clínicas es evaluada en pacientes con trastornos dermatológicos 
y gastrointestinales. En ambos grupos, se toma una muestra de 
2 000 personas y se obtuvo que las medias son 18 y 12 con 
varianzas de 34 y 73 respectivamente. ¿Es MEYERS el índice en los 
pacientes dermatológicos? 


105. En los carnavales de Río de Janeiro se toman dos muestras indepen- 
dientes de tamaño 3 entre los bailarines masculinos y femeninos más 
destacados y se pesan antes y después de desfilar por el Sambódromo. 
Los hombres bajaron 5 kilos y la mujeres 11. Se acepta la normalidad 
y las varianzas respectivas fueron 16 y 0,01. ¿Hay diferencias significa- 
tivas entre la perdida promedio por peso? Use a, = 0,1. 


106. Se toman muestras de personas que acuden al psicólogo para 
- valorar si es igual el por ciento de ellos que acuden por tras- 
tornos de ansiedad y de estado de ánimo, y los que el trastor- 
no es achacable a la etiología ocupacional. Los primeros fue- 
ron el 52,3 % y el 26,8 de los 250 entrevistados. ¿Son iguales 

los por cientos? 


107. Las ganancias de un portafolio es analizada sobre la base del 
| comportamiento de dos corredores de bolsa. Se toman 15 
portafolios de Bond € Company y 25 de Pacastain Ltd. Vea los 
resultados en la Tabla 4. 31. 
TABLA 4.31. 
Ganancias promedio den una muestra de portafolios 
de 2 corredores de bolsa en un año 


Media 


Firma ] : Varianza 
(millones de ganancia) 
Bond Cia : 28,02 11,04 
Pacastain Ltd. 10,92 


¿Es mayor la esperanzas de la ganancia poniendo el portafolio en 
manos de Bond £ Cia. con una significación del 0,01? 


108. Se analiza el índice de diversidad biológica existente en dos regio- 

nes boscosas. Este se mueve teniendo como valor máximo el 5.. 

Los resultados del muestreo de 50 áreas en cada región, apare- 

- cen en la salida correspondiente de un paquete estadístico. ¿Qué 
diría sobre este estudio analizando la Tabla 4.32? 
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TABLA 4.32. 
Análisis de los resultados del estudio de la memoria olfativa de mellizos 


95,0% 
prende EA 


| N | MEAN| | STDEV | TDEV |SEMEAN | | 


in l so 1521 0174 | 005 
Región 2 50 , dde 0,552 | 0,078 
PValor=0,00 GL= 


109. Los hábitos de los. consumidores de un mercado son estu- 
diados. Se toma una muestra de los clientes habituales y 
otra de los que acuden esporádicamente al mismo. A ellos 
se les pregunta cuál es la calificación que dan al trato reci- 

-bido en las cajas. Los que pagaron con tarjeta de crédito 
la valoraron como promedio con 22 puntos de 100 posi- 
bles, y su desviación fue de 3,10. Los que pagan al conta- 
do asignaron 25 puntos promedio con una desviación de 
3,20. ¿Es significativamente granos la diferencia observa- 
da con a, = 0,05? 


Respuestas 


1.Z = -1,12 y el P-valor correspondiente es aproximadamente de 
0,1314, por tanto, la hipótesis de que son igualmente eficientes no 
se puede rechazar, para un o. menor que ese valor. 


2. SÍ. 

4. No. 

5. No. 

6. H,:  < 20 es aceptada. 

8. No. 

9. Al menos a ese nivel, sí. 
11. No. 
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13. 
15. 


17. 
20. 
22. 
24. 


25. 
27. 
29. 


31. 
32. 


34. 
35. 
39. 
40. 
42. 
45. 
46. 
47. 
49. 
53. 
55. 


Sí, pues lo es para a > 0,1. 


La aproximación normal es aceptable y Z = 2,5. El P-valor para Z 
es de 0,0062; por lo que hipótesis H,: 1 < 20 será rechazada para 
valores de a, menores que ese valor. 


Sí, pues acepto H,: 1 > 300, pues lo es para a > 0,1. 
Al menos para este nivel, sí. 
No. 


Puede decirse que más del 75 % lo apoya con una altísima signifi- 
cación (a < 0,01 y el p-valor es aproximadamente cero). 


Sí, le aceptamos, para los niveles de significación entre 0,01 y 0,1. 
SÍ. 

Como Z = -1,25 y H,: P = 0,20 el P-valor = P(|Z|>1,25) = 0,21 y la 
aceptamos. 

No. 


Establecemos que H, : 4 > 0 y t = 2,57 que para 9 grados libertad 
le corresponde un P-valor de 0,017, aproximadamente. 


El estadígrafo es -1,1, por lo que aceptamos la igualdad. 
El se plantea que u < 46 000, lo que no es aceptable. 
No podemos rechazar H,: u = 4. 

Sí. | 

Sí. 

Sí. 


Para C1 se acepta que es mayor que 500 kv-h la producción. 
sí. 

Acepto la hipótesis nula de que sí lo son con a = 0,01. 

SÍ, pues el P-valor es del orden 0,000. 

No. 
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57. 
59. 


60. 


61. 
62. 


64. 
66. 
68. 
69. 
71. 


73. 
74, 
76. 
77, 
79. 
81. 
82. 
84, 
85. 
87. 


90. 
91. 


No, pues el estadígrafto de prueba no pertenece a [2,18 17,54], 
Sí. 

Acepto H.. 

SÍ. 

a) Acepto la igualdad. 


b) El método permite asegurar la independencia reflejable por la 
misma causa de variación en la valoración de la pareja. 


Como el estadígrato es menor que T(4, 0,90) = 3,37, no lo haría. 
No la aceptamos, para la flexibilidad y la simplicidad. 
SÍ. | 
No. 
SÍ. 
Sí. 
Son significativamente diferentes. 
Sí. 
SÍ. 
SÍ. 
= -1,6; por lo que aceptamos H.. 
Las varianzas son iguales, pero las medias son diferentes. | 
SÍ. 
Las varianzas son iguales y no existen diferencias significativas. 


El estadígrato F = 1,14; por lo que las varianzas son iguales y el 
de / correspondiente T obtuvo el valor 0,4 , por lo que aceptamos 
que las medias son similares. 


SÍ. 
Sí. . 
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101. Sí. 

104. SÍ. 

105. No la hay. 
107. No. 

109. No lo es. 
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Capítulo 5 
Análisis de la Varianza 


-5.1. Introducción 


Una investigación estadística puede ser llevada a cabo a partir de ha- 
cer observaciones o de realizar experimentos. Un estudio observacional 
clásico es aquel en el cual seleccionamos muestras de una población. 
En un estudio experimental, se identifican algunas variables de interés 
y se controlan algunos de los factores que pueden estar afectando su 
realización. Esto permite obtener una información menos afectada por 
- causas externas a las del tenómeno que estudiamos. : 


Cuando tratamos el estudio de varias poblaciones, la comparación de 
las medias es llevada a cabo utilizando un modelo: el modelo lineal. 
En este se asume que el valor de la variable en la respuesta obtenida 
en la población ¡ en la unidad ¡ es descrito por un factor asociado a la 
población general, y por un efecto asociado a la subpoblación corres- . 
pondiente. Esto es descrito al establecer que la subpoblación está aso- 
ciada a un tratamiento que puede hacer diferir la respuesta particular. 
El interés del experimentador es establecer si los efectos de los trata- 
mientos son nulos o si alguno de ellos es diferente de cero. Esto impli- 
ca que las medias de un tratamiento con efecto nulo tenga media igual 
a la de la población total. Esto se explica a partir de que la diferencia 
de las respuestas de un tratamiento respecto a la general será cero, si 
no hay diferencias significativas. De ahí el sentido de evaluar las 
varianzas para comparar medias. 


Al hablar de las medias del tratamiento partimos de que estas son 
parámetros desconocidos, y toda la valoración es llevada a cabo a 
partir de la estimación de ellas y de las diferencias respecto a la media 
general. Bajo la hipótesis de normalidad e independencia, los estadígra- 
fos de prueba desarrollados siguen una distribución F-Fisher. Las prue- 
bas correspondientes se basan en este hecho. 
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Aun cuando la normalidad pueda ser falsa, la robustez de los métodos 
del análisis de varianza permite utilizar, sin que haya grandes afectacio- 
nes de la potencia y el nivel de significación de la prueba, los procedi- 
mientos que se presentan en este capítulo. 


Ordinariamente los niveles de la variable de clasificación (factores) son 
asumidos como fijos. Los modelos asociados son llamados de efectos 
fijos. Si los niveles de los tratamientos son considerados como una 
muestra aleatoria de una población de tratamientos, se dice que el 
modelo es de efectos aleatorios. Algún mecanismo aleatorio es utiliza- - 
do para asignar las unidades a los tratamientos. Si hubiere una mezcla 
de efectos fijos y aleatorios se dice que el modelo es mixto. Las distin- 
ciones entre los modelos de efectos fijos y aleatorios determinan un 
cambio en la forma de modelar el experimento; pero, al razonar los 
métodos del análisis de varianza, son similares. Por ello los cambios 
externos en la forma de desarrollar las pruebas son sutiles, pero las 
inferencias difieren en su naturaleza. 


5.2. La clasificación simple y el diseño 
completamente aleatorizado 


Cuando solo hay un factor de clasificación para las unidades dal 
mentales, el modelo es: 


2,4 +, 
donde: 


¡: representa al tratamiento aplicado (í = 1,...,k) y 


j: la unidad cuya respuesta se obtiene (¡= 1,...,n). Se asume que e, es 
un error aleatorio con distribución N(O, a?) independiente. Por otra par- 
te, la media del tratamiento es representada por: 


¿=u+a, 
donde: 


u: es la media general y 
a; es el efecto del tratamiento ¡ siendo: 


a 0,= 0 
La hipótesis de interés es: 


H.: u,= u paratodo ¡= 1,...,/ 
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contra: 
H,: existe al menos un / para el cual u, + u 


Una estimación de la media y la varianza de cada tratamiento ¡ es 
obtenible al computar. 


n,-1 
El aporte de la varianza dentro de los tratamientos es: 
: SCE= Y, (n.— 1)s? 


Esta es llamada Suma de Cuadrados del Error o Residual y tiene n —/ 
grados de libertad donde: 


La media total es: 


Entonces la estimación del efecto del tratamiento / es: 
A, =X,-X 


y la Suma de Cuadrados debida a los tratamientos es: 


La que posee |-1 grados de libertad. La Suma de Cuadrados Total está 
dada por: 


Lon, Lon, Lon q? 
32 2 2 7 
ser PY 0 ts ir En E 
¡all jell ¡all j=11 ¡all ¡=li n 


Esta posee n — 1 = (/— 1) + (n — |) grados de libertad. 
Por otra parte, la Suma de Cuadrados del Error o Residual es: 


SCE = SCT — SCA 
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Dada la asumida normalidad de los errores: 


e MCA = SCA/o? sigue una distribución Chi-cuadrada con | - 1 gra- 
dos de libertad. 


e MCE = SCE/o* sigue una distribución Chi-cuadrada con n — | gra- 
dos de libertad. 


e F= MCA/MCE sigue una distribución F-Fisher con / - 1 yn-=1 
grados de libertad. 


Por tanto, siF > F(/- 1, n-—|, 1— a) se acepta la hipótesis alternativa H,: 
Esto es reflejado en la tabla siguiente: 


TABLA. 
Análisis de Varianza para la Clasiticación Simple 


Causa dela 
Variación * 


SCEM - 


Esta tabla permite reportar los resultados obtenidos en forma concisa 
y tipificar el análisis. Esta es la salida básica de los sistemas de progra- 
mas estadísticos con pequeños cambios. 


Ejemplo 5.1. Un psicólogo utiliza cuatro métodos de enseñanza y evalúa la 
velocidad con que resuelven un problema nuevo. Los resultados fueron: 


¿Influyen los métodos en la velocidad de responder los alumnos? Use 
un nivel de significación de 0,05. 
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Solución : 
T,=18, T,=17,7,=16,7, = 13 
n,=4,n,=3,N,=3,N,=3 


SCT = 504 424 224 724 424824 504 424 604 674 224 724 42 
(18 + 17 + 16 + 13) /13 = 356 — 315,08 = 40,92 


SCA = 182/4 + 17?/3 + 16%/3 + 13/3— (18 + 17 +16 + 13)?/13 = 319 
- 315 = 3,92 


SCE = 40,92 - 3,92 = 37,0 


Entonces podemos reflejar todos estos resultados en la tabla de Aná- 
lisis de Varianza correspondiente. 


TABLA. 
Análisis de Varianza 


Causa de la Grados de Sumas de Medias 
Variación libertad Cuadrados Cuadráticas 


F 


Como F(3,9 0,95) = 3,86 aceptamos que todas las medias son iguales. 
Es decir, que los tratamientos no difieren en la velocidad de respuesta. 


Cuando se detecta la existencia de diferencias, es necesario estable- 
cer cuáles generan esa diferencia. La Prueba F-Fisher utiliza el 
estadígrafo de prueba: : 


A =D 


MCE( +4) 


A; j 


Si|t,1> t(n — 1, 1 - 0/2), aceptamos que los correspondientes trata- 
mientos difieren. En particular podemos utilizar como procedimiento 
el aceptar la diferencias entre los tratamientos / y j: 


[x, -x,|>1(n-1,1-0)/MCE A 
e, Md IS 
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La hipótesis a validar en el Diseño Completamente Aleatorizado son 
las mismas que en el de Clasificación Simple: probar si las medias de 
los tratamientos son iguales. Sin embargo, en el Diseño Completa- 
mente Aleatorizado se asignan aleatoriamente las unidades a los diver- 
sos tratamientos, tratando de evitar los efectos debidos a propiedades 
de las unidades experimentales. 


Ejemplo 5.2. La puntuación asignada a tres revistas en seis números 
tomados aleatoriamente fue: 


Analice si estas poseen el mismo puntaje promedio. Si no fuera así 
determine cuáles difieren. 


Solución 
Los resultados obtenidos utilizando Minitab fueron: 


TABLA. 
Analysis of Variance 


74,34-83,66 
74, 0000 69,34-78,66 
66,0000 
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Entonces, hay significativas diferencias entre las medias de los trata- 
mientos. Esto es detectado por ser P un valor pequeño con respecto a 
los posibles niveles de confianza. Además, note que F > F(2,15, 0,99). 
El valor de 5,354 es el de la varianza a utilizar en la detección de las 
medias que difieren. El paquete nos brinda además las diferencias. 


*Significatively different at 0,05 level. 


Es decir, la media del tratamiento C difiere de la del A y la del B. Ay B 
“ no son diferentes desde el punto de vista estadístico. En nuestro caso, 
VMSE(1/n, + 1/nj) = 6,59 para todo par /, . 


5.3. La clasificación Doble y el Diseño 
de Bloques Aleatorizados 


Se puede estudiar el efecto de dos factores A y B, cada uno con varios 
niveles, en una característica determinada de la población. 


El objetivo fundamental es investigar si las medias de las poblaciones, de- 
terminadas por los niveles de los factores, son iguales o si difieren. También 
. Se puede probar si las interacciones entre los factores son iguales o no. 

El modelo que usamos es: 

Mig = M, TE, parai=1,..,./j=1,...J¡k=1,... K 
donde: 


4, =4+0,+P,+ y, 
o. es el efecto del factor A, , 


ij? 


p;: es el efecto del factor B, y 


y, es la interacción entre E factores A, y B, e,, es un error aleatorio que 
sigue una distribución (0,0?) independiente. Las hipótesis sobre la au- - 
sencia de efecto es: 


Aa: 9,= 0, para todo / = 1,..../ 
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Hg: B, = O, para todo j =1,....J 

Fosa: Y = 0, para todo ¡=1,..lyj¡=1,...J 

El modelo que se analiza parte de suponer que se realizan K réplicas 
de cada combinación de factores. Por tanto, el número de observacio- 
nes es n = JJK. 


Los efectos son estimados por 


e e Lk=l jalo fal hal a T 
JK JE JK IIK 
poK 1 JOE 
yy Xin yn PS Hi 
4 0 a ¿O 
$ A 7 E dal kl Hi j=alk 4 j 
i po IK IJK IK UK 
K 
Xi; 
Y, =3,-% aa 
Ey K K nh 


La descomposición de la suma de cuadrados total queda como: 
SCT = SCA + SCB + SCAB + SCE 


donde: E > 
A] Na LE 
scr = , yz k=l sa 
i=l ¡=1 
I T 2 T 2 
SCA = a — 
2, JK n 
J T? 2 
SCB = —  — 
2 I n 
tomando: 


se tiene que la suma de cuadrados debida a las interacciones está dada por: 
SCI = SCBE — SCA - SCB 


Tk 

YX, | L 

j=l Kal Ty T 
lis »> TJ n Ze n 
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obteniéndose: 
SCEESCTESCARESOR + SEI 
- La tabla de Análisis de Varianza es: 


TABLA. N 
Análisis de Varianza Modelo de Clasificación Doble 


E Camas Grados de; Suma de Medias 

. libertad | cuadrados cuadráticas 
Factor A NENE Y. CMA=SCA/ - 1 F =CMA/CME 
FactorB PERE CMB=SCB/] - 1 F, =CMB/CME 


Interacción U=DGU=1 CMINI=1XJ=1) | F¡=CMUCME 
Error IXK-1) CME=SCE/AKK- 1) AO 


Podemos dar solución a la comparación simultánea de dos criterios 
de clasificación (factores), como el siguiente: 


Ejemplo 5.3. Se quieren comparar tres niveles de dosis de un nuevo 
medicamento y tres niveles de una enfermedad. Se mide el tiempo que 
demoran en recuperarse, y se obtiene: 


Diga si los niveles de dosis y los de la enfermedad no afectan en la 
respuesta obtenida. 


Solución 
T=5+7+..+ 32 = 294. 
SCT = 25 + 49 +...+ 1 024 - (2943/12 = 5 954 -— 4 802 = 1 152. 
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SCA =1[(15 +...+ 6)? + (18 +...+ 20)? + (23 +...+ 329*]/6 — 4 802 = 
5 733 — 4 802 = 931. 


SCB =[(5 +...+ 21)? + (7+...+32)? + (8 +....+ 32)? ]/6 - 4802 = 
4 906,33 — 4 802 = 104,33. : 


SCAB = [(5 + 7 +...+ 30)? + (8 + 8 +...+ 32)? ]/9 - 4 802 = 4 087,56 
-4 802 = 5,56. 


SCBE = (5 + 8)? +...+ (30 + 32)? - 4 802 = 5 926 - 4 802 = 1 124. 
SCE = SCT - SCA - SCBSCI = 28. 
Entonces obtenemos: 


TABLA. 
Análisis de Varianza Modelo de Clasificación Doble 


Cama Grados de Suma de Medias 
libertad cuadrados | cuadráticas 
Lia 465,5 149,68 


co 
Nivel de la MES 104.33 52,16 16,77 
iteracción Ed A 88,67 22,17 


enfermedad 
Error 


Total 


Como: 


1. F(2,9, 0,95) = 4,26; los niveles de las dosis y de la enfermedad po- 
seen medias significativamente diferentes. 


2. F(4,9, 0,95) = 3,48; la interacción entre los niveles de dosis y de la 
enfermedad influye en la respuesta. 


Podemos suponer que las diferencias observadas son generadas por 
factores ajenos al experimento. Esto puede hacer que la razón de 
varianzas F, en la tabla de Análisis de Varianza, sea pequeña por confun- 
dirse los efectos reales con los de estos factores. Podemos controlar 
algunas de esas fuentes para aislar su contribución a las sumas de cua- 
drados. La estirnación del efecto de los tratamientos será mejor por medir 
la contribución pura del factor de interés. En este caso, p, = 1 + 0, + B 
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La tabla de Análisis de Varianza queda como: 


TABLA. 
Análisis de Varianza: Modelo de Bloques Completamente Aleatorizado 


Calas Grados de] Suma de Medias F 

bis libertad | cuadrados .cuadráticas 

ESCROrA CMA=SCA/I-1 | F,=CMA/CME 
(Tratamiento) 


Factor a CMB=SCB/J-1 | F,=CMB/CME 
] (Bloques) 
A (-DU-D a CME=SCE/I-1)- Ml 


donde: 


dE) 


j=l 


SCE = SCT — SCA -—SCB 


+ J 
I 
X, 
3 ¿7 
+] I 
I J 
ISE 
ÓN 
y 


Ejemplo 5.4. Un operador de turismo considera que, con sus nuevas 
ofertas, se incrementarán en un por ciento igual la afluencia de turistas 
respecto a la campaña anterior. Este tiene tres tipos de destinos turísti- 

cos, de acuerdo con el peso en la oferta. Son estas: Playa, Ecología e 
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Historia. Para comprobar su hipótesis, toma una muestra de seis de 
sus agentes en el extranjero, los cuales realizan un recorrido por cada 
una de los destinos-ofertas. Cada uno hace una proyección del por 
ciento de incremento de sus clientes habituales. Se obtuvo: 


Agente , Playas Ecología Historia 


Diga si acepta lo que dice el operador turístico. 
Solución 


El análisis de los datos nos lleva a que: 


Agente : > O o y Medias de 
(bloque) Playas Ecología Historia los bloques 


Medias de los 
tratamientos 
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Nuestro objetivo es ver si las medias de los tratamientos difieren entre 
sí. La tabla de Análisis de Varianza es: 


TABLA. 
Análisis de Varianza: Modelo de Bloques Completamente Aleatorizado 


“usa Grados de Medias 
bc libertad o cuadráticas 


AGontos” > « 


Error. 


Como F(2,5, 0,95) = 4,10; no aceptamos que sean iguales los incre- 
mentos. 


La significación de la diferencia entre bloques no es de interés para 
la prueba, sin embargo, esta puede ser efectuada cuando sea nece- 
sario establecer si estos tienen un comportamiento diferente. En el 
ejemplo, cada bloque (agente) es sometido a los / tratamientos. Esto 
lleva a que el diseño sea calificado de completo. Puede llevarse a 
cabo experimentos en los que se someten a las pruebas tipos de 
diversos individuos que se califican de similares. Si no, todos los 
bloques tueran asignados a todos los tratamientos, así se dirá que 
es de Bloque incompleto. 


Note que este modelo se dedica a probar hipótesis sobre un solo fac- 
tor. Por ello el modelo estudiado antes que él puede ser llamado de 
dos factores. En general, aquellos en los que se utilizan más de un 
factor, son conocidos como. experimentos factoriales. 


Ejercicios 


1. Para el aprendizaje de un idioma se tienen tres métodos: A, B y C, y 

se desea saber si estos difieren. Se tomó una muestra aleatoria de 
tamaño 16 y se dividió aleatoriamente en tres grupos. A cada uno se 

- le aplicó un método de enseñanza. Al final se les realizó un examen 
que medía lo aprendido. Los resultados fueron: 
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Método A Método B Método C 


INICIAN IEA ESA 


¿ Afirmaría usted que, al nivel de significación del 5 %, los tres méto- 
dos ofrecen iguales resultados? 


-2. En un experimento se desea analizar el efecto de 4 dosis de un 
determinado narcótico. Se seleccionó una muestra aleatoria, lo más 
homogénea posible, de 24 sujetos y se dividieron en 4 grupos. A 
cada grupo se le aplicó un cierto nivel del medicamento y se midió 
cuántas horas tardaban en reaccionar ante un estímulo olfatorio. 
Los resultados fueron: 


Dosis 2 Dosis 3 Dosis 4 


- ¿Puede afirmarse, al nivel de significación del 5 % , que la dosis no 
influye en el tiempo de reacción? 
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3. Se desea analizar si las condiciones ambientales influyen sobre el 
número de aciertos ante determinado test de concentración. Se con- 
sideran 3 tipos de condiciones ambientales y se seleccionaron 18 
sujetos, los cuales se dividieron aleatoriamente en 3 grupos. Cada 
grupo fue entrenado bajo una de las condiciones ambientales y se 
observó el porcentaje de aciertos en los intentos. Los resultados fueron: 


¿Puede afirmarse al nivel de significación del 5 % que las condicio- 
nes ambientales producen iguales resultados en cuanto al por cien- 
to de aciertos? 


4. Un instituto dispone de 3 métodos de clasificación y desea saber 
cuál produce resultados mejores, en cuanto al tiempo utilizado para 
completar una tarea clasificatoria. Se evaluaron 12 individuos y 
aleatoriamente de dividieron en 3 grupos de 4 cada uno. En cada 
grupo se utilizó un método de enseñanza. Al final se le evaluó cuán- 
to demoraban en clasificar un grupo de testores idénticos. Los re- 
sultados fueron: 


Diga si considera los métodos como equivalentes. 
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5. En un experimento se deseaba analizar el efecto de 4 dosis de un 
medicamento para el acné juvenil. Se seleccionó una muestra en un 
grupo homogéneo de individuos en términos de sus capacidades 
físicas. A seis de ellos se les aplicó la dosis 1, a cinco la 2, la 3 a otros 
cinco y el resto recibieron la 4. Se observó luego el tiempo que tar- 
daron en reaccionar al tratamiento. La tabla obtenida fue: 


Fuente de 
+ . . Á 
variación 


Complete esta tabla y diga si puede afirmarse, al nivel de significa- 
ción del 1 %, si la dosis influye en la velocidad de curación. 


6. Se desea investigar el efecto que produce sobre el aprendizaje de 
un idioma el método y las condiciones ambientales. Se tomó una 
muestra de 30 sujetos y se dividieron en 3 grupos de 5 individuos 
cada uno. A cada grupo se aplicó una de las 6 combinaciones de 
método y condición ambiental. Al final, se les realizó una prueba que 


medía su aprendizaje integral. El resultado fue: 
OTTO ET9 078 Método A | Método B | Método C 
85,16 


Diga qué efectos se consideran significativos al nivel del 5 %. 
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7. Se desea investigar el efecto que produce sobre el tiempo de reac- 
ción, durante la digestión, de dos dietas alimenticias y el tiempo de 
trabajo previo. Las resultados en 47 sujetos fueron: 


Dieta , Dosis 1 - Dosis 2 Dosis 3 Dosis 4 


59 59 54 68 
52 54 67 64 
57 60 44 74 
86 68 58 70 
79 80 60 63 


68 84 76 74 


39 39 39 48 
32 34 47 44 
37 40 24 54 
67 48 * 38 S0 
39 60 40 43 
48 69 dl 54 


¿Aceptaría usted, al nivel del 5% , que no hay afectación en la res- 
puesta por parte de estos factores? 


8. Se desea establecer si la velocidad y adecuación del reflejo a estí- 
mulos auditivos son afectados por la edad y el nivel intelectual. Se 
consideraron 3 grupos por categoría de edades y 3 de nivel educati- 
vo. En cada uno de los sujetos se midió un coeficiente que estable: 

-Cía la calidad de la respuesta. Los resultados fueron: 


| Nivell | Nivel2 | Nivel3 |. 
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¿Afirmaría usted que la edad y el nivel cultural tienen influencia 
significativa en la calidad de los reflejos? Use a. = 0,05. 


9. En un experimento llevado a cabo para examinar el efecto de 4 dietas 
sobre el peso de cerdos, los cuales fueron alimentados con las siguien- 
tes dietas desde su nacimiento, con una de las dietas siguientes: 


Dieta A: Grano típico (GT). 

Dieta B: GT + Suplemento proteínico. 

Dieta C: GT + Suplemento energético. 

Dieta D: GT + Suplemento proteínico y energético. 
Los datos fueron: 


di 


La tabla de Análisis de Varianza obtenida usando Minitab es: 


TABLA. 
Analysis of Variance on 'peso' 


so rs 
e] AA 


Determine si hay o no diferencias significativas entre el peso pro- 
medio asociados a las dietas. 


10. Cinco fábricas producen alimento para ganado. Se toman muestras 
de la producción de cada una para evaluar el contenido de miligramos 
de Tiamina por cada un millón de partes. Los resultados fueron: 


200 


Fábrica 1 Fábrica 2 Fábrica 3 Fábrica 4 Fábrica 5 


45,1 42,4 45,1 43,3 42,8 


¿Brindan el mismo contenido las fábricas? Si no lo fuera diga, cuá- 
les difieren. 


11. El uso de fertilizantes es analizado a partir de los contaminantes 
que aporta al medio ambiente. Tres métodos son comparados. Lle- 
ga a nuestras manos la información siguiente: 


Source 
Treatment 


Error 


Total 


| Diga qué método de fabricación entrega un mayor contenido de 
contaminantes. 


12. Se analizan 3 grupos de obesos y se aplican 3 métodos para bajar 
de peso. A cada grupo se le aplicó un método. Los kilogramos 
bajados en una semana fueron para Grupo 1: 1,2; 0,3; 1,4; 2,7 y 
1,9; para el Grupo 2: 1,1 y 3,8 y para el Grupo 3: 2,0; 0,7 y 1,9. 
¿Tienen resultados diferentes los métodos? 


13. Se estudia la resistencia de plásticos a temperaturas altas. La fatig 
del material es evaluada así: : : 
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A a 


se | 90 100 | 110 | 


ENEE 
1 84,1 | 77,5 | 70,3 
86.6 | 799 | 72,3 
| 3444 775 71 


¿Difieren las s en términos de !a fatiga? 


14. Seev dúa un Tn o unálisis de taboratorio, Se envía una mues- 
tac 'a misma susianaia a 7 laboratorios, En cada uno de ellos, 3 
analivuas realizan le prueba. Los resultados que cbtenemos apare- 
cen en la tabla de Análisis de Varianza paa siguiente: 


DY To ss 


j 

? O 

i 28 
ba 

1 

| 


Haga el análisis correspondiente. 


15. Se someten varios deportistas a pruebas de eficiencia física, las 
que se califican entre U y 100. Tres tipos de deporte son compara- 
dos: atletismo, levante miento de pesas y gimnasia. Se obtiene: 


¿Puede considerarse cue estos deportes generan la misma eficien- 
cia en sus deportistas? 


15. Antes de envar e: mercadeo un megaicamento, se indaga sobre si el 
empaquetamieno a uiliizar influye soore el tiempo de vencimiento. 
Se tomaron 3 grupos de 10 tabletas cada uno y se evaluó el tiempo 
de vencimiento de elas. La tabla fue: 


202 


Source -- 


Tre atment 


Error 


Dé su evaluación del efecto de los empaquetamientos. 


17. Se estudia la resistencia de plásticos a temperaturas y estrés. La 
fatiga del material es evaluada obteniendo así: 


Diga si considera influyentes esos factores en la fatiga del plástico: 


18. En una industria química se investiga la efectividad de tres tipos de 
catalizadores. Se tomaron doce soluciones de las sustancias quí- 
micas a reaccionar y se midió el tiempo de duración de cada una. 
Se obtuvo: 


Catalizador A: 2 1 3 1 
CatalizadorB:1 5 1 2 
Catalizador C:3 4 1 2 
Analice si existen diferencias con un nivel de 0,01. 


19. Un médico aplica tratamientos con aureomicina a pacientes con 
5 enfermedades infecciosas diferentes. El tiempo que demora- 
ron en sanar completamente fue medido y se desea saber si se 
puede dar la misma evaluación de su efectividad para todas las 
enfermedades. Treinta enfermos sufren sometidos a este trata- 
miento y se obtuvo: 
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Sri Es A AT o o 
Enfermedad 


¿Considera similares los resultados? 


20. Se analiza la calidad de la producción en 4 líneas, las que pueden 
ser trabajadas por 5 distintos operarios. Diga si difieren los índices 
de calidad, si estos fueron: 


44 38 47 36 


A 


21. Muestras de un mineral fueron sometidas a dos procesos químicos 
diferentes para separar el níquel del cobalto. Tres temperaturas se 
utilizaron y así se obtuvo la cantidad de cobalto mostrada en la 
tabla siguiente: 
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22. A partir de las siguientes muestras de láminas anuales de precipi- 
tación, compruebe si las cuencas son homogéneas en términos 
de la lluvia caída por año. 


San Juan y 
Martínez 


1 850 1 925 1670 
CECI ARTE II 
EH 


23. Un tour operador oferta un paquete en tres ciudades españolas y 
evalúa lo que gastan 6 grupos de turistas en artesanías locales, de 
cada una, en la gira. Diga si puede decirse que tuvieron el mismo 
gasto promedio si se tiene: 


Cuyaguateje Caimito Mani-mani 
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TABLA. 
Analysis of Variance 


946,00 


79,00 


| Pooiled Sidevi 5,3 


Halle los Intervalos de Confianza de los gastos promedio, Use un nivel 
del 5%. ¿Qué ciudad aporta turistas con mayores gastos en artesanía? 


24. Compruebe si hay homogeneidad en el comportamiento caracteri- 
zado por las medias de la concentración de Ph en el suelo de 3 
regiones geográficas, muestreadas durante el recorrido de una gira 
de ecología turistica, sí los resuitados fueron: 


O 


0.92 
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20. 


26. 


Tabla del ejercicio 24 (continuación) 


| Región 2 Región 3. 


1,28 


Se asignan aleatoriamente 5 jugadores de baseball para batear 
tres tipos de lanzamiento: recta de 90 m/ph, curva rápida y, slider 
que efectúa una máquina. E! average de ellos fue: 

Recta: 580 640 550 660 670 

Curva: 580 680 640 710 690 

Slider: 590 470 490 480 570 

Diga si los resultados de este Diseño Completamente Aleatorizado 
sostiene que batean con igual efectividad los tres tipos de lanzamiento. 


Se repite el experimento del ejercicio anterior con 30 jugadores, y 
se obtuvo que la Suma de Cuadrados Total fue de 10 954,689 y la 
de los tratamientos fue de 4 557,891. Diga si, en este caso, hubo 


- diferencias significativas al 1 %. 


27. 


Se supone que la concentración del ¡on cloruro en la lluvia es homogé- 
nea en media en todo el país. Para comprobarlo, se seleccionaron mues- 
tras en diversas regiones y se obtuvieron los resultados siguientes: 


Tamaño de muestra 


¿Es válida esta afirmación? 
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- 28. Se tomaron 6 tipos de bateadores y se sometieron a la experiencia 
de los ejercicios 25 y 26, después de una sobrecarga de ejercicios 
de calentamiento, y se obtuvo: 


MOTO AC AT 


¿Afecta igualmente a todos los tipos de bateadores los tipos de 
lanzamiento en la misma forma, después de la sobrecarga? 


Diga si considera aceptable esa hipótesis. Al nivel del 5 %. 


29. Para comprobar si la temperatura máxima media es la misma en 
todas las zonas al sur de un punto, se tomaron muestras en 4 pun- 
tos, con los resultados siguientes: 


387000 | 387600 | 383000 | 389 000 


Realice la prueba correspondiente al nivel del 1 %. 


30. Se estudian tres cuencas fluviales y se desea establecer si son 
homogéneas respecto al escurrimiento. Se usaron datos de 20 años 
y se obtuvieron las tablas siguientes, utilizando Microsta: 


Dé su evaluación del problema: 


a ANOYA 


Tabla del ejercicio 30 (continuación) 


Casals st] vasos [00 vay | ANOVA] 
PA oo 
A an AA 
ae | 25967 00 
som | sumotsguares| DE | mensquas| E | 
visin [110945300] 57 | o0s1ó79 | > 
ra [rom] JT 


31. Se toman muestras aleatorias del mismo tamaño entre estudian- 
tes de tres facultades diferentes y se evalúa el gasto que hacen por 
mes en su asistencia a la Universidad. Los resultados fueron: 


Facultad 1:92 89 98 105 
Facultad 2: 81 86 75 90 
Facultad 3: 90 102 96 88 
¿Tienen similares gastos promedio? 


32. Dos tipos de tiendas para el turismo son sometidas a un nuevo 
régimen de rotación de inventarios. Se proponen dos rotaciones y 
se analiza en dos tiendas de cada tipo. El por ciento de disminu- 
ción de las pérdidas por vencimiento de la garantía fueron: 


Diga si se aprecian efectos de los factores analizados y sus 
interacciones. 


33. Se tienen 4 cuencas de la vertiente norte de la cordillera de 
Guaniguanico y se quiere analizar si las precipitaciones en ellas 
- son homogéneas, en término de sus medias. Para ello, se tomaron 
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muestras de láminas anuales durante 10 años en las 4 cuencas, y 
se obtuvo la información siguiente, como salida del sistema Microsta: 


Analysis of ANOVA 


¡ a 
A a 
¡Aa DE A TEA RAE 
EN O 
A AA 170 A MATA 
AUD ERA OA ET E ERC 
E 
Source | SumofSquares [DE [Mean Square [E] 


Betmeen | 123705500 |] 
"0 DERRIDA VARIA VEINTE CENA 
A YA 


¿Qué diría usted? 


34, Se quiere determinar si las transformaciones hechas por el hombre 
en los últimos años han afectado las precipitaciones en una cuen- 
ca. Se analizaron 3 períodos de 10 años. Los resultados fueron: 


Período “mar de lluvia 


500 


3 900 [00 | 950 [15 000 
1 00 [000] 750 ] 900 [100] 600] 00 [1000] 1 000] 1200] 


Diga si considera que las medias anuales promedio en otra cuenca difieren. 
35. El análisis de varianza del paquete Microsta nos dio los resultados siguientes: 


| Analysis of | Variance | One Way | ANOVA | | 
Ll | Gram | Men | N [| _ | 
AO A EA O 
IA CERA OA OS E 
EE TETON BEA INS 


A EAT E ETA 
Probabili 
1701500 | _2 [| ____ | 06231 


MELENA DISENO DEA 
_ Total 2939622,200 | | 


¿Qué afirmaría usted? 
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Respuestas 


. Se rechaza la igualdad. . 

. No se rechaza la igualdad. 

. No influyen las condiciones en los aciertos. 
. No se rechaza la igualdad. 

. No se rechaza la igualdad. 

. Hay efectos diferentes. 


. No se acepta que haya efectos de los métodos ni de las condicio- 
nes, pero sí en las interacciones. 


8. No hay efectos significativos en ningún caso. 
10. 


JAOO0_AO0ONa 


Source ' 


Treatment 


La fábrica 1 entrega mayor contenido promedio de Tiamina, la 3 
más que el resto, y la 4 más que la 5, al nivel del 0,05. 


12. No se rechaza la igualdad. 
13. 


Source 
Temperature 


Total 


Por tanto, difieren. 
14. Se rechaza la igualdad. 
15. 
DEN 
[Treatment | 
| Ervor | 


F(0,99,2,17) = 6,11, por lo que aceptamos la existencia de diferen- 
cias significativas. Se acepta que el atletismo se asocia a una ma- 
yor eficiencia física. El resto, son similares 
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Source 
 Temperatare_ | 3] 


3 
Como el percentil F(3,9) = 3,86, concluimos que no influyen. 
19. 


Source 


Y es significativa la prueba para el nivel del 0,01. 


23. No es necesario terminar la tabla para obtener la no aceptación de 
la igualdad al 5 %, pues p < 0,05. El IC para la tercera media es 
61,34-70,66. Las ciudades 1 y 2 tienen igual media y estas son 
significativamente mayores que los de la tercera. 


25. 


Source DF 


Ml or | ¡NOR 

52 000 

| Error | Y | ES 
EE 


12 34 000 203303 
Por lo que no aceptamos la igualdad. Los dos primeros lanzamien- 
tos tienen una media igual, pero ambas difieren de la del tercero. 


26. Son significativamente diferentes. 


28. Los lanzamientos siguen teniendo distintos promedios (tratamien- 
tos), también difieren los tipos de bateador. 


31. No difieren significativamente. 


32. Las rotaciones tienen un efecto significativo, pero no existen ni para 
los tipos de tienda ni para las interacciones. 
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Capítulo 6 
Correlación y Regresión 


6.1. Introducción 


En muchas aplicaciones de la estadística se enfrenta la necesidad de 
determinar la existencia de una cierta relación entre varios fenómenos. 
Este es caracterizado por dos o más variables. El decisor requiere de 
una medida objetiva de la fuerza de esa relación. El coeficiente de co- 
rrelación la mide en el sentido de la relación lineal existente entre dos 
variables. Esta es una medida numérica y cuantifica cuan agrupados 
se encuentran, los pares de variables observados, alrededor de una lí- 
nea recta. La determinación de la recta más cercana a la muestra bivariada 
observada es obtenida utilizando un criterio de optimización. El más 
popular se asocia a la minimización de la distancia cuadrática. Este 
es el conocido método de los mínimos cuadráticos. Una fórmula explí- 
cita permite computar las estimaciones de los parámetros de esa rec- 
«ta, conocida como recta de regresión. La ecuación correspondiente, 
ecuación de regresión, permite caracterizar el comportamiento de los 
datos. Con ella podremos hacer predicciones de valores de una de 
ellas [Y] a partir de los valores de la otra [X]. 


Bajo hipótesis adecuadas (normalidad, independencia, etc.), se pue- 
den hacer pruebas de hipótesis y calcular intervalos de confianza. 
Cuando hay más de dos variables cambian algunos procedimientos, 
pero se mantienen las ideas básicas al medir la relación entre pares 
de variables, entre todas ellas y determinar una ecuación de regresión. 
Este es el problema de la regresión múltiple que, por su complejidad 
numérica, generalmente solo es resuelto usando algún paquete de pro- 
gramas estadístico. En ella observamos: 


MX, XK]. 
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Ejemplos clásicos que necesitan de resolver problemas de correlación y/ 
o de regresión son los asociados a la necesidad de determinar como se 
relacionan el coeficiente ae inteligencia y la calificación de una prueba de 
aptitud; el comportamiento de las calificaciones de los estudiantes en una 
carrera utilizando las calificaciones reflejadas en el expediente escolar, el 
coeficiente de inteligencia y los resultados de una prueba de ingreso; el 
aumento de peso de reses a partir de los distintos componentes de su 
dieta, el aumento del consume de electricidad con el crecimiento de la 
población, etc. El investigador desea conocer cómo se relacionan las va- 
riables entre sí. Si esta relación es adecuada, podrá también predecir los 
resultados de la variable de interés [Y] al conocer los valores de las que 
puede medir con facilidad. Estos problemas pueden ser estudiacos utili- 
zando los modelos y técnicas que veremos en este capítulo. 


6.2. El coeficiente de correlación 


Un primer problema, cuando tenemos un conjunto de nbservaciones 
bivariadas [X, Y], es determinar si ellas están relacionadas. Tanto X como 
Y son medidas numéricamente. A partir de tener una rmusstra de tama- 
ño n, obtenemos el valor de [X, ,Y] en cada unidad muestral ¡ = 1,2,...N. 
Decimos que las observaciones son pareadas. Ante la pregunta inicial, 
se abren otras interrogantes pues el decisor quiere conocer también la 
forma de la relación y su fortaleza. Para ello debe estudiar X y Y, simul- 
táneamente, utilizando métodos particulares. 


Lo primero que se nos pueda ocurrir es hacer un gráfico donde ambas 
variables aparezcan reflejadas en un plano. Le llamamos Diagrama de 
Dispersión a este gráfico. Su análisis nos da una idea de lo que ocurre. 
En las figuras 6.1-6.4 podemos ver algunos casos ilustrativos. Anali- 
zando estos gráficos obtenemos una visión sobre la relación entre las 
variables. Si existiere algún patrón estos nos los mostraría. 


Ejemplo 6.1. En un centro laboral se mide en 3 obreros los años de 
trabajo y el grado de valoración de la administración en una escala del 
í al 20. Los resultados fueron: 


TABLA 6.1. 
Valoración de la Dirección Centro +1 


Años - 


Valoración 


Scatterplot (bouza.sta 2y*5c) 
y =0,025 + 0,575*x + eps 


Valoración 
> 
in 


3 5 To ss 7 11 13 
FIGURA 6.1. Diagrama de dispersión del Ejemplo 6.1. 


Note que se observa un patrón que sugiere que la valoración crece con el 
número de años en el centro y que la relación parece ser lineal. Se requie- 
re objetivar esto, pues si tenemos otro centro en el que observamos los 
resultados de la Tabla 6.2, los análisis sugerirán lo mismo. Ante la pregunta 
de dónde es más fuerte la relación, no tendremos argumentos objetivos. 
TABLA 6.2. 
Valoración de la Dirección Centro +2 


Scatterplot (bouza.sta 2v*7c) 
y = 0,314 + 0,28*x + eps 


Valoración 


Años 


FIGURA 6.2. Diagrama de dispersión de la Tabla 6.2. 
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La información de que nos proveen estos Diagramas de Dispersión no 
es suficiente para explicar la relación. Nuestras impresiones sobre cúan 
cerca de una línea recta están los datos pueden ser cuantificados usan- 
do el coeficiente de correlación. Nosotros utilizaremos el coeficiente 
- de Pearson, cuya fórmula es: 


” 


e 00; aa y) 


i=l 
¡ Ya 0 o - y! 
i=l i=l 


Este posee una serie de propiedades que le han hecho acreedor de la 
aceptación que tiene. Estas son: 


y= 


1. Su valor siempre está entre -1 y 1. 


2. Sila relación es directa, la pendiente de la banda en que están las 
observaciones es positiva, r > O. 


3. Si la relación es inversa, la pendiente de la banda en que están las 
observaciones es negativa, r < 0. 


4. Si la relación es directa y muy fuerte, r es aproximadamente 1. 

5. Si la relación es inversa y muy fuerte, r es aproximadamente -1. 

6. Si la relación es muy débil, r es aproximadamente cero. 

Ejemplo 6.2. Usando los datos del Ejercicio 6.1 tenemos (ver Tabla 6.3): 


TABLA 6.3. 


AY 0-yY- QA-)0,-y) 


por lo que, r = 0,972. Esto puede considerarse alto. r puede conside- 
rarse como el estimador del coeficiente de correlación de la distribu- 
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ción bivariada correspondiente p. Cuando ambas variables son nor- 
males y se observa una muestra aleatoria, podemos hacer pruebas 
de hipótesis sobre p. Para ello es necesario hacer una transtormación, 
pues este estadígrafo no se distribuye normal. Una transformación que 
permite usar pruebas normales es: 


ZA 05 ES a = tanh"(») 


Este estadígrafo se distribuye: 


y osu( 522) a | 
l-p jn-3 


Por ello, podemos usarle para hacer pruebas de hipótesis y hallar 
intervalos de confianza. En particular, el problema más común es de- 
sear conocer si X y Y son independientes. Esto es planteado como: 


H.: p = 0. Si las variables son normales y aceptamos esta hipótesis 
tenemos que es aceptada la independencia entre X y Y. 


Para hacer las pruebas hacemos uso de: 


2,-10,5In 1+ Po 
1=P, 
f= 
n 
n-3 


Entonces H,: p = p, es aceptada sil 1 < z,,,, . Otra prueba se basa en 
el uso de tablas especificas. Vea la Tabla para Pruebas de indepen- 
dencia del coeficiente de correlación en el Anexo. 


Ejemplo 6.3. En una muestra de 5 centros de producción de azúcar se 
midió un índice de la contaminación de las aguas que cada uno apor- 
taba al medio ambiente y el existente en las aguas subterráneas aleda- 
ñas. Se obtuvo que (ver Tabla 6.4): 

TABLA 6.4. 


Aportada 
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Calculando tenemos que: 
e e e 
- Ei =14 
il 


YY (a 10=23 
2 


> (y -yY=40 

ze 1 Y 
Internacionalmente se establece que si la correlación entre los niveles 
de contaminación de los vertederos y el de los pozos es mayor que O, 
es necesario aplicar fuertes sanciones a los contaminadores. 


¿Sugiere usted hacerlo con la empresa a la que pertenecen? Use un 
nivel del 0,05. 


Solución 


r = 0,972 lo que sugiere que la correlación es alta y positiva. No pode- 
mos hacer pruebas de hipótesis pues no se conoce si las variables son 
normales. 


En el próximo ejemplo podremos hacer la prueba de hipótesis sobre la 
correlación exixtente. 


Ejemplo 6.4. En una muestra de 40 consumidores de electricidad en 
un pueblito, se obtuvo que la correlación entre el tiempo promedio de 
permanencia en el hogar y el de kilowatts de consumo tuvieron una 
correlación de r = 0,8895. Aceptando la normalidad de ambas varia- 
bles, pruebe si p = 0,8 con a = 0,05. 


Solución 
1 + 0,8895 
Z 7 OS L2e0% =1,4195 
ñ 1 - 0,885 
1+0,8 Ñ 
E H,1=0,51n —) = 1,09 
lz e] ( 0 3) 
dé 0,3205 
= =2— =19495 
0,1644 


Como el percentil es 1,96 aceptamos la hipótesis. 


Para la independencia, la prueba se basa en que p, = 0 considerando 
la normalidad. 
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Note que r es un resultado numérico. Es decir, mide la relación existente 
entre los números utilizados en su cálculo, que son los resultados de varia- 
bles aleatorias o no. No podemos usarle para justificar la existencia de rela- 
ciones entre los fenómenos que generaron X y Y La relación causa-efecto es 
validada solamente por su existencia objetiva. El decisor, al analizar su pro- 
blema considera, usando su experiencia, que entre estas variables existe 
una relación. Observa una muestra y establece si cree que su conjetura es 
válida y no puede usar r para justificar la validez sin un análisis de la objetivi- 
dad de ella. Por ejemplo, si medimos el crecimiento de la caña de azúcar 
durante un año y el consumo de cerveza, no podremos decir que hay una 
relación causa efecto entre ambos fenómenos. Un aumento en el consumo 
de cervezas puede estar dado por los cambios climáticos de la estación que 
influencia también en el crecimiento de la caña. El coeficiente analizado fun- 
ciona adecuadamente también si las variables envueltas son cualitativas o 
de rango. En el primer caso, basta con hacerle corresponder valores numéri- 
cos a las variables. La utilidad de r siempre dependerá de cuán adecuada- 
mente representa esta transformación al fenómeno estudiado. Si las varia- 
bles fueran rangos, puede utilizarse sin cambios. En la práctica, si ellas fueran 
Bernoulli el desarrollo de la fórmula para esos casos particulares simplifica 
considerablemente los cálculos a llevar a cabo. Similarmente ocurre cuando 
son rangos. También la distribución correspondiente varía, lo que permite 
estudiar la aproximación normal de los estadígrafos correspondientes. 


6.3. La Regresión Lineal Simple 


En el análisis de regresión el objetivo es ajustar una ecuación a una serie 
de observaciones bivariadas. El modelo establece que Y = B, + B,X + e. 
B, y B, son parámetros desconocidos, deben estimarse, y e es una 
variable aleatoria desconocida, y no observable. Y es una variable 
aleatoria dependiente, llamada también regresando, predictor o varia- 
ble de respuesta. Ella es observada junto con X la que es una variable 
independiente denominada algunas veces regresor o variable de con- 
trol. El valor de Xes conocido sin error. Este modelo es llamado mode- 
lo lineal. En general en el problema de regresión, las variables envuel- 
tas toman valores reales. Si hubieran variables aleatorias (x o y), el 
problema es más complicado y no lo tratamos aquí. 

Los parámetros son estimados a partir de las observaciones de X y Y. El 
método más comúnmente utilizado para hacerlo es el de los mínimos 
cuadráticos. Los estimadores son determinados con la ayuda de: las 
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ecuaciones normales o resolviendo el correspondiente problema de Máxi- 
ma Verosimilitud. En general, lo que se desea es que, una cierta distancia 
entre las variables y la ecuación de la recta obtenida, sea mínima en 
promedio. Los estimadores mínimo cuadráticos buscan minimizar: 


Y e? = Y ly >, -tx,) 
¡=! ¡=l 


Este método es muy popular, pues brinda una solución explícita y, fórmulas 
compactas, para el cálculo de los parámetros de la regresión. Estas son: 


b,=y=b,x 


$ (y, E Ya, -x) 
i=l 


n 


b,= 


La recta de regresión es dada por la ecuación: 
Y=b,+b,x 


Ejemplo 6.5. Se hacen pruebas de aptitud a 5 niños antes y después de 
ser ayudados por un psicólogo. Los resultados fueron (ver Tabla 6.5): 


TABLA 6.5. 


Halle la ecuación de regresión y diga si esta puede considerarse adecuada. 


Solución (ver Tabla 6.6) 


TABLA 6.6. 


E A ER 


EZ ERICA RE O 
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usando los resultados de la Tabla 6.5 y: 


r= 158 =0,9928 
158-178 


por lo que el modelo lineal es adecuado. Las estimaciones de b, y b, son: 


20 105083 
158 


b, = 102 -1,05063(102) =-5,16426 
y la ecuación de las regresiones: 
$ =-5,16426 + 1,05063x 
Cuando los errores (residuos): 
e,= y), 


se distribuyen N[0,0?] e independientemente los estimadores compu- 
tados a partir del método de los mínimos cuadráticos son insesgados. 
La estimación de o? y las varianzas de los estimadores están dadas por: 


Sí, - 3,1 
dal 


s?= 


Ñ n-2 
y: 
2 
ví) == 
AO STD 
202 
V(b,)=0| +5 
YO, -x y 
V(G5,)=0* 1, 
Ya -x Y 


Dada la normalidad de estos estimadores y que s”, esstimo insesgadamente 
la varianza, tenemos que sustituyendo a? por este estimado, se obtienen 
intervalos de confianza utilizando la T-Student con n-2 grados de libertad. 
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Estos son: 


di 


1C(B,)=| b, -1(n-2,1-0/2) |s. 


IC(,) e -1(n-21-0/2) ls * 


9 (2,1 0012) [5] =+ 44 


Similarmente podemos hacer pruebas de hipótesis. Note que si acepta- 
mos que H/,: B, = 0 esto significa que la variable X no influye en la respues- 
ta dada por Y. Cuando H,: B, = 0 indica que la recta de regresión pasa por 
el origen. Rechazaremos estas hipótesis cuando If. | >TI[n-2, 1- 0/2]. 


La predicción Y* = b, + b, X*, a partir de un cierto valor X*, es obteni- 
da al evaluar la ecuación de regresión. 


Ejemplo 6.6. Se utilizan las pruebas de aptitud a 5 niños, antes y des- 
pués de ser ayudados por psicólogos del ejemplo anterior. Se sabe 
que los residuos son variables normales independientes. Reanalice este 
problema y dé sus recomendaciones. 


Solución 


TABLA 6.7. 


Niño 1 Y 3 4 5 


Como las estimaciones de los parámetros son b, = 1,05063 y 
b,= -5,16426 


A 


Y =-5,16426+1,05063x, 


es la ecuación de regresión. Su uso nos permite obtener los residuos e, 
y determinar la Tabla 6.7. 
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A partir de esos resultados, tenemos que estimamos la varianza resi- 
dual como s?, = 3,3459/3 = 1,153. De ahí que los errores de los 
. estimadores son: 


v[b,] = 1,1153/158 = 0,0071 
y: 
v[b,] = 1,1153[0;2+9102)*/158] = 73,6634 
La predicción de la observación asociada al niño dos tiene varianza: 
v(5 ,) = 1,1158(0,2 + (104 - 102)?/158) = 0,2513 | 
Entonces, como t(3, 0,975) = 3,182 los correspondientes intervalos de 
confianza para a: = 0,05 son: 
IC[b]=]1,05063-t(3,0,975) v(b,)*?, 1 ,05063++(3,0,975)v(b)'? 
[ =]0,78263 1,3243[ 
IC[b,1=]-5,1646-t(3 ,0,975) v(b,)**, -5,1646+t(3,0,975)v(b)'*[ = 
]-32,476, 22,146| 
y: 
IC[S,]=102-t(3,0,975) v( LANE 102+t(3,0,975)v($,)'?=(100,40582, 
103,5942) 


Aunque es evidente que los parámetros son distintos de cero, podemos 
hacer una prueba y obtenemos que las hipótesis de nulidad son rechaza- 
das, pues t[3 0,975] = 3,182. Sin embargo, la hipótesis H,: Y, = 105 
no es aceptada. 


Entonces, recomendamos la ecuación obtenida, la que establece la exis- 
tencia de una relación directa y fuerte entre ambos resultados, y no cree- 
mos que el niño dos obtenga calificación después del tratamiento de 105. 


La significación de la ecuación de regresión puede hacerse a partir de 
considerar que la varianza residual puede ser escrita como: 


(Ds =Y O, Oy =S 7-57 
i=l i=1 


El segundo término representa la variabilidad explicada por la ecua- 
ción. Esta debe ser grande si la ecuación es válida. Tomando: 


medimos la cantidad de variabilidad explicada por la regresión. Note 
que R?, llamado coeficiente de determinación, está entre O y 1. Reco- 
mendamos la ecuación, si este toma un valor cerca de uno. Esta medi- 
da no depende de la distribución de los residuos. 


Ejercicio 6.7. Analice si es adecuada la ecuación de regresión obteni- 
da en el ejercicio anterior, utilizando el coeficiente de determinación. 


Solución 


En el ejercicio anterior A? = 0,976, lo que soporta que la ecuación de 
regresión obtenida sea adecuada. 


Al utilizar un paquete estadístico, aparece en sus tablas de salida la 
información sobre la desviación típica de los estimadores de los 
parámetros [Standard Deviation], lo que permite calcular, usando una 
calculadora, el intervalo de confianza correspondiente. En ellos tam- 
bién aparece el estadígrato de prueba, para la hipótesis de que el 
parámetro es cero. Este es denotado “razón T” [ Tf-Ratio]. El valor de la 
probabilidad de que se obtenga un valor mayor que él es también brin- 
dado. Todos estos resultados son resultado de estadígrafos de prueba 
que presuponen la normalidad de los residuos. 


Ejemplo 6.8. Use los programas correspondientes del paquete Minitab 
para analizar los datos de la Tabla 6.8: 


TABLA 6.8. 


=Post natalidad en po 150 | 16s | 170 
ciento, +“; 


Solución 


Del programa Correlación del Minitab obtenemos de su tabla salida: 


MTB>Correlation Cont(1V)” PN(PCTY 


Correlation of Cont(LV) and PN (PCT) = 0,985 


Por tanto, en los datos analizados r = 0,985, lo que es alto. 
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El de regresión nos brinda la información siguiente: 


MTB> name C3="COEF1"; 
MTB>Regress “Cont(LV)1 “PN(PCT); 
SUBC>Coefficiente “COEFI”. 
The regression equation is 

CONTE VS 2HOENren 


e 
MOS EIN 
MECO INTO IRC ECN IR 
esto fresasoor]  lagagmoss| | 


sea que la ecuación de regresión es: 


$ =132+10x 


y un valor alto del coeficiente de determinación (0,97) nos recomien- 
da esta como adecuada. El T-Ratio nos permite hacer las pruebas de 
hipótesis. Como P nos da la probabilidad de observar valores tan altos 
como el observado y este es menor que los valores 0,10, O, 05 y 0,01, 
rechazamos la hipótesis de nulidad de b.. 


Se espera que la regresión explique adecuadamente las variaciones. 
Por tanto, el modelo es adecuado si el valor computado de la razón 
entre los errores cuadrados medios, debidos a la regresión y a los 
residuos supera el percentil correspondiente. La validez de esta prue- 
ba de hipótesis radica en la normalidad, independencia y homo- 
cedasticidad de los residuos. 

Ejemplo 6.9. Analice los datos del ejercicio anterior utilizando el SAS. 
Solución 

Si usáramos el paquete SAS para analizar los datos del ejemplo ante- 
rior, el procedimiento a usar es PROCREG. Los comandos son: 

Title “Regression Analysis' 

data estate; 

infile z1,y; 

proc reg data=state 

model y=z1 
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La salida es: 
Model: Model! 
Dependent variable: Y 


Analysis of Variance 


*Sumof Mean 
Squares Square 


a po 


Root MSE 10 R-Square 0,97 
| Deep Mean: 152 Adj. R-sq 0,96 
C.V. 20,80 


FValue  Prob F 


AITOR ¡El 
SO EE 


Parameter Estimates 


P € % S Pr O 
_ Variable DF arameter tandard T for H, 
Error  Parameter=0 


AA DET PEOR BA 


Note que el uso del Minitab también nos da una tabla de Análisis de 
Varianza. Su análisis es estudiado en el capítulo 5. 


Es muy común que la variable independiente sea medida con un error 
también. En estos casos, es necesario utilizar métodos especiales. 


Aunque hemos visto el problema de la regresión lineal, puede haber 
relaciones de otro tipo entre las variables. Por ejemplo, puede haber 
una relación expresable por una parábola, la relación lineal es entre 
X y el logaritmo de Y, etcétera. 


Ejemplo 6.10. Se evalúa el número de conexiones entre dos nodos de 
la red y el tiempo utilizado en milisegundos para transmitir el mensa- 
je. Los resultados fueron (ver Tabla 6.9): 


TABLA 6.9. 


Occ 


226 


Analice la adecuacidad del ajuste mediante una ecuación de regre- 
sión lineal. 


Solución 


Note que r es pequeño, pero si hacemos la transformación y' = yy, 
tenemos que y' = (404 52 6,33 8,0 7,2 99 8,1 10,2 
125 14,7). 


En este caso r = 0,92, por lo que es aceptable que la relación es lineal 
siendo la ecuación de regresión: 


$'= 0,166 + 0,237 


6.4. Regresión múltiple 


Cuando tenemos k variables independientes X, ,X, ,....X, el modelo 
lineal lo expresamos como: 


k 
y = By+B,x +...+B,x, +€ = B, + Y Bx,+€ 
i=] 
Cada B, es un parámetro desconocido y e una variable aleatoria no 
medible. En este caso nuestros datos son dados como (ver Tabla 6.10): 


TABLA 6.10. 
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Entonces, podemos fijar que : 


App B, 
y) €, 
B, 
Y == X == B E e= 
Y A Ñ Ak B, €, 


son los datos y que el modelo lineal es expresable mediante: 
Y = XB+e 


la solucion del problema utilizando el Método de los Mínimos 
Cuadráticos es sencillo en términos matriciales. 


$=b,+bx,+..+b,x, =b+P0, 


¡Aj 


ba 


b, 


== OY 


b, 


Entonces, los estimadores de los parámetros desconocidos de la re- 
gresión son obtenidos nuevamente a partir del mismo criterio. En la 
práctica, un paquete de programas es utilizado por este fin dada la 
magnitud de los cálculos envueltos. 


La ecuación de regresión obtenida permite predecir valores de la va- - 
riable dependiente a partir de las observaciones de las k variables in- 
dependientes. La estimación de la varianza residual es: 


dr 2 
20 5,) _YY-PUX'Y 
n=k n=k 


que estima a o?. Dada la normalidad y como podemos aceptar que 
los estimadores son insesgados con varianza 
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donde: 

c, = elemento ¡ la diagonal de (X"X)”. 

La valoración de la significación de la ecuación obtenida puede ser 
evaluada usando una Tabla de Análisis de Varianza Simple. Una fuen- 
te de variación es la Regresión, esta tiene k-1 grados de libertad, y la del 
Error es la correspondiente a la varianza Residual que tiene n-—k. Bajo la 
hipótesis de normalidad una prueba F puede ser realizada. La tabla es: 


TABLA. 
Análisis de la Varianza 


Fuente de grados de Sumas de Medias 


AS : ye Razón F 
Variación libertad Cuadrados  Cuadráticas 


SCR | MCR=SCR/k-1 | MCR/MCE 


Error 


Si la normalidad no es aceptable recurriremos al coeficiente uso del 
coeficiente determinacion R?. 


Ejemplo 6.10. Se ajusta un modelo de regresión y se obtiene la ecua- | 
ción de regresión: 


$ =5,12+0,03x, +0,023x, 
057 


La Tabla de Varianza obtenida es: 


Fuente 
A GL 
Variación 


CRIA CT E 


resinas | 22 ptas pos 
sa a 


Analice si es adecuado el modelo si la distribución normal es aceptada. 
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Solución 


Ante el cumplimiento de las hipótesis necesarias como el percentil 
F[2,22;0,90] = 2,56 aceptamos la ecuación como descriptiva de la re- 
lación. : 

El interés del decisor es obtener una ecuación que permita carac- 
terizar la relación y que sea lo más simple posible o que refleje la natu- 
raleza del fenómeno en forma comprensible para él. Esto conlleva a la 
selección de ur, modelo, entre los varios posibles y aceptables. Los 
sistemas de programas tienen instrumentado su búsqueda determi- 
nando varias ecuaciones que describen las relaciones entre la varia- 
ble de respuesta y las independientes. Diversos criterios permiten hacer 
esto. El más popular es el llamado de Selección Paso-a-Paso (Stepwise). 
La evaluación de los modelos es reflejada en el coeficiente de deter- 
minación y en la Tabla de Análisis de Varianza correspondiente. 


6.5. Análisis de residuos 


Al hacer el ajuste de una ecuación de regresión podemos determinar 
las diferencias: 


EA TI 
llamadas residuos. Su estudio nos permite determinar algunas de las 
posibles causas del no ajuste del modelo utilizado para describir la 


relación. A cada dato le corresponde un residuo. Podemos plotearle y 
tres comportamientos caracterizan el modelo. 


FIGURA 6.3. El modelo es correcto. 
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x 


FIGURA 6.4. La varianza no es constante. 


Xx 


FIGURA 6.5. Deben incluirse, uno de ellos cuadrático. 


y 


FIGURA 6.6. Falta un término. 


Si se plotea respecto a la predicción y el significado es la Figura 6.3, el 
modelo es correcto. Si'es la Figura 6.4, la varianza no es constante y 
debe hacerse una transformación de Y. Si es la Figura 6.5 , el modelo 
no es correcto y deben incluirse otros términos y/o transformar Y. Al 
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hacerlo para una variable independiente, la Figura 6.3 sugiere que el 
modelo es correcto, la Figura 6.4 que la varianza no es constante y Y 
debe ser transformada, y la Figura 6.5 establece que deben incluirse 
términos, posiblemente como función de la variable y/o una transfor- 
mación de Y. 


Ejemplo 6.11. Se evalúa el tiempo de experiencia de varios operarios y 
se le hace una prueba de habilidad evaluada en una escala de 1 al 10. 


Los resultados son: 


>=. MEDDE 
experiencia 
ERARIO REACCION 


Calificación 
Analice el comportamiento de la regresión entre estas variables. 


Solución 
Al usar Minitab como paquete se obtuvo: 


MTB> name C3="COEF 1"; 
MTB>Regress ÁNO(AE)1 “CAL(CAL)'; 
SUBC>Coefficiente (COEFI”. 

The regression A is 


| Cal CALV)=4,52+ 
PREDICTOR l COEF | - STDEV | TRATO | RATIO 


Como el T-Ratio es mayor que el percentil para valores de 0,10 y 0,05 
del nivel de significación, no parece adecuada la ecuación. El cálculo 
de los residuos nos lleva a la tabla: 


ccacó NOA DE E EIA CS CA 


por lo que s,? = 3,01 y s, = 1,74. 
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FIGURA 6.7. Gráfico de Y vs residuos. 


Note que el grafico respecto a Y sugiere la Figura 6.6. Incluyendo 
como variable x? tenemos que la ecuación de regresión es califica- 
ción = 10,5 - 2,0x + 0,2x? la que es adecuada. Compruébelo. 


Ejercicios 


1. Se califica el pudor en los dos miembros de una pareja, obteniéndose 
las calificaciones siguientes: 


sor ENEE EEES 


Diga si considera que la relación es directa y que la correlación es 
mayor que 0,8. Asuma la normalidad. 


2. En una empresa se mide el nivel de eficiencia y el de interpretación 
de las regulaciones técnicas. Si los datos obtenidos fueron: Eficien- 
cia 0,1; 0,1; 0,2; 0,5; 0,4; 0,4; 0,3; 0,2 y 0,3 e Interpretacion 0,1; 0,1 
0,4; 0,7; 0,3; 0,6; 0,2; 0,4 y 0,4, diga si considera que existe una 
relación fuerte entre estas variables. ¿Acepta que la correlación es 
mayor que 0,5 si la distribución normal es aceptada? 


3. Tenemos la medición de la calificación de tres pruebas psicológicas 
en 5 escolares. Estas son: 
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Prueba 1 Prueba 2. Prueba 3” 


Diga qué variables se relacionan fuertemente. 


4. Una muestra de 12 ancianos con nivel universitario es tomada en un 
asilo y se evalúa su coeficiente de inteligencia, basado en pruebas 
realizadas en su madurez, y una prueba de arterioesclerosis. Los 
valores obtenidos fueron: 


> DOBOECCCCOE 


¡ El 
ae 


Diga si considera que hay una relación directa y fuerte entre ambas 
medidas. 


5. La tabla siguiente indica las edades [X] y las presiones sanguíneas 
sistólicas de 10 mujeres utilizando un aparato digital. 


sv OOO 


a) Haga un diagrama de dispersión de los datos. 


b) Diga si cree que existe una relación lineal fuerte entre las dos 
variables. 


6. En un determinado hospital el nivel de colesterol en sangre fue de- 
terminado por dos métodos diferentes con vistas a relacionar am- 
bos resultados. Los resultados obtenidos fueron: 


Método A (X) | 180 | 189 18 


Método A (Y) 175 | 170 | 178 
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Haga un diagrama de dispersión y justifique que la relación es fuer- 
te si este es el caso. 


7. En una investigación se deseaba investigar la relación existente en- 
tre el peso corporal y los resultados en una prueba de eficiencia 
muscular. Se tomaron 6 estudiantes de nivel medio y se obtuvo la 
tabla de datos siguiente: 


a) Analice el correspondiente Diagrama de Dispersión. 
b) Calcule el coeficiente de correlación e interprételo. 


8. Se considera que la temperatura tiene un efecto sobre la cantidad 
de errores que comete un operario en una fábrica. Se tomaron 12 
días y se midió el número de errores y la temperatura del taller. Los 
resultados obtenidos aparecen en la tabla siguiente: 


Temperatura Errores 


Calcule el coeficiente de correlación lineal y diga qué cree de esta 
relación. 
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9. Se tomó una muestra de 10 jugadores de pelota y se midió la fuer- 
za de sus lanzamientos y la de su potencia al batear. Los resultados 
reportados fueron: 


Lamanieno EJEA ENEE ES El EE 
rocio EA O 


Diga sí considera que hay una alta correlación positiva. 


10. Se desea investigar si la productividad es predecible a partir de la 
calificación en un test psicológico sobre la motivación. Se obtuvo que: 


1,59 1.49 1,45 2,04 1.13 1,98 1.20 2.10 1,71 1,34 0.98 1,30 1,23 1,12 1,00 0,97 


27 )) 
2 ¿ na D¿ 
3419 na 232 4 


de 37 23 21 9 23 42 34 12 26 


Diga qué opina de la correlación entre las variables. 


11. En una investigación sobre jóvenes trabajadores se midió la efi- 
ciencia y el tiempo de experiencia. Se desea saber si hay una rela- 
ción significativa partiendo de la normalidad de los datos. 


Diga qué opina si se obtuvo: 


Eficiencia Experiencia (en meses) ' 
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12. Se estudió la relación entre el tiempo de capacitación asignado a 
los especialistas en computación en el último año y su eficiencia 
como programadores. Los resultados fueron: 


Tiempo de capacitación en horas Eficiencia en por ciento 


Diga si hay una relación significativa entre estos factores si acepta 
la normalidad. 
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13. El por ciento de páginas que fueron dedicadas en revistas especializa- 
das de un país durante los últimos 3 años a un tema fue medido. Se 
midió este resultado respecto al de una revista de punta del tema. Diga 
si considera adecuada la relación entre las analizadas y la de punta. 


Revista * 
de punta 
13,4 


Revista 1 Revista 2 Revista 3 Revista 4 


3,34 


SRL SET DOMINO INEA 
¡VOS 0UN RAE ARO DAA ERRE E 
AA 
PSOTO_ IIA E CONO ERRE E CIS EE 
E a al 
¡ECC BATEO IEA PV DE 
AAA TRATA 
DUNAS] GEN IA JAEN AECE NA 
¡TAO MUSEO E EVI EEC 
AOICTIARO DORA IARO AE ETA CORA BEE 
CRIAR IMA ARO ME 00 [ERE MR 
REA Ln BEA ETT OR 
EONETICINAS AEREO [EAN ERA A A 
AANTCRNA DATAN EN ET HOMERO 
a 
A 
DEAR II) IE O ECO 
Ni si 
ACTICIN ROO TC E IC 
MIINCTECIONO IEMINICIOO IOMA OCIO IRTE 
A a 
E A A 
EN PON RRA DUAL OOO ET 
Es a e] 
a e 
POCO CE EAN 
o a 
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14. Se estudia la relación entre el incremento en el tiempo. de vida de 
un circuito integrado y el de un modelo básico de reproductora- 
grabadora VHS bajo altas cargas de voltaje. Los datos obtenidos son: 


¿Podemos aceptar que la relación es significativa con un 95 % de 
confianza? Acepte la normalidad. Utilice las pruebas T y F. 


15. Durante un año se midió el consumo de jugo y de bebidas alcohó- 
licas. Analizando el crecimiento reportado en las plantas de caña 
de azúcar en un laboratorio se obtuvo una correlación de este con 
el consumo de jugos de -0,92 y con el de bebidas alcohólicas de 
0,87. Diga qué opina de estos resultados. 


16. Calcule el coeficiente de correlación lineal para las observaciones 
hechas del largo del húmero y el fémur en 5 fósiles de indios taínos 
hallados en cuevas del occidente. ¿Considera alta la relación? 


17. Leemos un reporte publicado en un diario sobre un estudio de la 
relación entre la emisión promedio de ácido sulfúrico y su concen- 
tración en el aire de la ciudad principal de 14 provincias. 


¿Qué señalamientos haría ud. a lo reportado en cada provincia por 
separado?: 


cocino MOI E IA O MOE 
Mrs EEE 


1, Hay una relación fuerte y positiva. 


2. Hay una relación fuerte y negativa. 
3. Hay una relación moderada. 
4. Hay una relación débil. 


5. Hay un error en los cálculos o la impresión. 
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18. Una muestra se toma en varias firmas para evaluar la calidad de 
los radio-grabadoras y Walkman adquiridos de una empresa. Se 
evalúa el número de reclamaciones por cada 1 000 y el predicho 
por el suministrador. Los resultados fueron: 


Firma - Electrin Godoy Megal Remín  — Dupaz 


Firma 
Real | 137 169 | 149 | 202 


Analice y diga qué opina de la relación entre lo que anuncia y el 
real. Acepte la normalidad. 


19. Evalúe en el ejercicio anterior si es aceptable que la correlación es ma- 
yor de 0,9. Si lo fuere, halle la ecuación de regresión y prediga el monto 
de las reclamaciones si la firma estableciese cifras de 80, 13 y 7. 


20. Compruebe que la relación entre el coeficiente de dureza del acero 
producido y la variable de pureza de los elementos usados en su 
fundición, se correlacionan significativamente. Halle la ecuación de 
regresión y halle la prediccón de la dureza del acero, si se tiene 
una pureza de 3,2 y tenemos la Tabla de Análisis de Varianza: 


CONTO ECT 
Re 


X1 
Anva 
gresión 
Error 
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21. Determine la ecuación de regresión lineal para predecir el pudor 
en la mujer usando los datos del Ejercicio 6.1. Diga se es adecua- 
da. Halle el intervalo de Confianza para la pareja de un hombre 
con calificación de 3,8. 


22. Es evaluada la relación entre el pudor en una muestra de jóvenes 
de 25 años y la dada a la doble moral de ellos. El cómputo de los 
resultados parciales es el siguiente: 


Y X=143, E, X2=2755, E_ Y=196,6, E'*_ P2=2 950, E, Y X=18260,8. 


Haga el análisis de la regresion. 


23. El contable de una empresa evalúa el crecimiento de su empresa 
mecánica y analizando el reportado en la rama electrónica. Diga si 
él puede predecir su crecimiento a partir de lo reportado. 


Reporte Rama electrónica Rama mecánica 


A IONES DONE TI IONES 
AURELIO FELINA AE ER 
A] 
ANAIIA 
ADAN. 


OA CUINA NI 
IONINONEONOOOOS IESO DO IEA 


Determine la ecuación de regresión y halle intervalo de confianza 
para el crecimiento de la electrónica si la mecánica crece en un 35. 


24. Utilizando los datos de 10 años, el gerente de una firma que 
distribuye grabaciones en videos, Cd's y casettes desea esta- 
blecer la relación entre el consumo de ropa, alimentos y medici- 
na con el gasto en esparcimiento. Los datos son en dólares por 
persona/mes: 
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Alimento . Es parcimiento E 


Halle la ecuación de regresión apropiada para hacer este estudio. 


25. Una aleación es elaborada y se desea caracterizar su resistencia. 
En una muestra se mide esta y los valores de la dureza del cobre 
utilizado, la del otro metal y la diferencia entre la temperatura pro- 
medio y la recomendada. Los resultados son: 


Resistencia Dureza Diferencia de temperaturas 


Tabla ejercicio 25 (continuación) 


26. Se mide el por ciento de mensajes devueltos por dos redes de 
correo electrónico. Evalúe si los resultados exhiben una adecuada 
correlación y halle una ecuación de regresión. 


27. Se obtiene la ecuación de regresión 2,6 + 0,7X, -0,9X, y la Tabla de 
Análisis de Varianza está incompleta. Diga si la ecuación obtenida : 
es adecuada aceptando la normalidad. Si tenemos: 


Due to 


Regression 


28. El modelo Y = B, + Y,_,*B,X, + e es ajustado al utilizar una muestra 
de 20 elementos. Si la suma de Cuadrados Total es 95,82 y la Resi- 
dual es de 45,05. Diga si la ecuación es adecuada. 


29. En una muestra de técnicos fueron evaluadas las variables siguientes: 
+ Grado de dedicación a la profesión. 


+ Nivel de dedicación a la profesión. 
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* Valoración de la estimulación salarial. 
» Estímulos morales dados por el colectivo. 
* Valoración de la atención a sus sugerencias. 


Determine una ecuación de regresión que permita fijar la relación 
de la variable 1 con las demás y de su valoración del problema 
utilizando los datos siguientes: 


Variable 1. Variable 2 Variable 3 Variable 4 Variable 5 


3 060 
9 700 


2 37 040 
3 067 39 789 


30. Se desea establecer la relación existente entre la pérdida de hidró- 
geno en el acero por millón), el tiempo (horas) almacenado y la 
temperatura promedio de almacenamiento (grados centígrados). 
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Pérdida de Tiempo de 
hidrógeno almacenamiento 


Temperatura 


a) Halle la ecuación de regresión. 


b) Diga si es adecuado el ajuste realizado y estime la pérdida si se 
almacena durante 45 días a una temperatura de 15 grados. 


31. En un centro de investigación se seleccionó una muestra aleatoria de 17 
sujetos epilépticos. El objetivo era averiguar si la concentración en san- 
gre de una cierta sustancia por cada 10 000 partes en cada uno de ellos 
dependía de la edad y de los resultados de dos tests. Los datos son: 


Test 1 


Y 
— 
po 


7 
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a) Puede afirmarse que podemos determinar el contenido de esa 
sustancia usando las variables medidas. 


b) ¿Cree posible o necesario utilizar otras variables o eliminar algunas? 


32. En un centro de investigaciones médicas se desea saber si el 
índice de aciertos en un test aplicado esquizoides entre 25 y 35 
años depende de la dosis en mg. de una cierta droga y del tiem- 
po de entrenamiento con los equipos que usará en el test. Los 
resultados fueron: 


a) ¿Puede afirmarse la suposición hecha al 0,05? 


b) Interprete el significado reflejado por los coeficientes de regresión. 


c) Estime la calificación para un paciente con un nivel 3,5 de la 
droga y 1,8 de entrenamiento. 


33. Se seleccionó una muestra aleatoria de niños para aplicarles dife- 
rentes tests y ver si la ortografía dependía de las cualidades que 
dichos tests medían. Ellos fueron: 


* Índice de Comprensión (IC). 
* Velocidad de Comprensión (VC). 
* Comprensión de Frases (CF). 


* Calificación de la Ortografía (CO). 
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Los resultados en la muestra fueron brindados en la Tabla de Aná- 
lisis siguiente: 


Predictor Coeficiente Stde y T-ratio 


Haga su recomendación a los especialistas. 


34. En una fábrica se estudia la influencia de diversos factores en 
la eficiencia. Se midieron % de tiempo de preparación del puesto, 
meses de experiencia, eficiencia, nivel de capacitación y eficiencia 
del test. Los datos computados fueron: 


Preparación ras Eficiencia Capacitación 


IEA 
ME 


Sugiera un modelo de regresión adecuado 


35. Se repitió la experiencia anterior en otra fábrica y se obtuvo la tabla 
siguiente: 


Preparación ros Eficiencia e Test 
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36. 


37. 


38. 


39. 


40. 


41. 


42. 
A3. 


44. 


45. 


Temperatura 12,7 | 12,4| 23,8] 16,5 


a) Realice el mismo análisis. 
b) ¿Qué opina de los resultados? 
Haga una análisis comparativo.. 


Sugerencia: Analice el comportamiento que tienen las pruebas 
de hipótesis sobre los parámetros de la regresión. 


Diga qué tipo de relación existe entre las calificaciones; halle la 
ecuación de regresión y estime la varianza. 


Si los errores en el Ejercicio 1 son normales e independientes, halle 
intervalos de confianza para los parámetros desconocidos de la 
regresión y predígalo para los hombres cuya pareja posee califica- 
ción de 5,5 o de 3,7. 


Con los datos del ejercicio anterior para la predicción del pudor en 
el hombre si el de su pareja es de 5,5 o 3,7, diga si acepta que es 
menor que 6. Use el nivel del 0,05. ¿Puede hacer un análisis similar 
para las mujeres cuyas parejas poseen estas calificaciones? 


Reanalice el ejercicio 2 y diga si acepta que la regresión lineal es 
un modelo adecuado, si la distribución normal es aceptada. 


Tome el ejercicio 4 y halle la ecuación de regresión evaluando si es 
adecuada. 


Calcule la ecuación de regresión que pronostique el resultado es- 
perado del método A usando el B en el ejercicio 6 y diga si acepta 
que el valor de la variable independiente 180 cuando X = 170, Acepte 
la normalidad. 


En el ejercicio 8 halle la ecuación de regresión. 


Diga si la ecuación obtenida en el ejercicio anterior es válida si 
acepta la normalidad. 


Halle la ecuación de regresión para los ejercicios 10, 11 y 12 y diga 
si esta es adecuada para hacer predicciones. 


Al estudiar el efecto de la temperatura (grados centigrados) de la 
cristalización primaria en la cantidad de fósforo (gramos por litro) 
en una solución se obtuvo: 


ios EE 


Halle el coeficiente de correlación y la recta de regresión. Diga si 


- considera adecuada esta ecuación para hacer predicciones. 
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Respuestas 


3. La matriz de correlación es: 


SER AL CO O 
EC CI A A 
os [ass] 
Pos ooo [ao [ip 


O sea, que se correlacionan altamente x1 - x2, x1 - x3 y X2 - X3. 


8. r = 0,86. La relación es directa, pero no es muy fuerte ni tampoco 
muy débil. 


14. t, =3,43 por lo que aceptamos que B, + O pues t(4, 0,975) = 2,776. 
Por otra parte, F = MCR/MCE = 11,74 y F(1,4; 0,975) = 7,71 por lo 
que la regresión explica un adecuado por ciento de la variabilidad. 


15. ¡Es un caso de correlación espuria! Otra variable está influyendo 
los consumos. 


16.r = 0,97 


17.r=0,94 y como el estadigrafo de prueba para la independencia 
es 4,5 aceptamos que no la hay. 


18. SCT = 15730, SCE = 1 530, SCR = 14 200 y R?= 0,9027. Por tanto, 
parece que es un ajuste aceptable al no tomar en cuenta la nor- 
malidad. Por otra parte t, = 8,62 por lo que B, * 0, lo que valida 
que el ajuste sea adecuado además F = MCR/MCE = 74,25 acep- 
tamos esta hipótesis usando el Análisis de Varianza. 


20. Había 9 muestras y v(b,) = 1,8496. Usando x = 3.2 tenemos una 
predicción de 23,072. 


22.r = 0,88 y la ecuación es 0,425 + 0,03X, la varianza residual es 0,079. 
26. b,= 2,74, b, = -1,07, r = 0,91, 1 = 6,213 y R*= 0,83, s*, = 7,96. 
27. La ecuación es 85,22 + 2,01x, + 4,7x,. Se espera una pérdida de 143,18. 
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28. Calificación = 83,2 + 2,29x, + 1,3x,. Todos los coeficientes son 
significativamente diferentes de cero. Por tanto, las dos variables 
son necesarias para hacer las predicciones e influyen positivamen- 
te en la respuesta. La predicción 52 es de 93,56. 


33. En la regresión no es necesaria la variable CF para hacer la ecuación. 
36. r = 0,88. La ecuación es 0,425 + 0,03X. S, = 0,079. 


* 37. 1C[b,]=]15,19 10,689T[, IC[b,]=]1,49 2,68[. La ecuación es 7,94 + 2,07X 
por lo que las predicciones son 19,325 y 15,6. 


42, 23,014 + 0,150X. 


250 


Capítulo 7 
Métodos no paramétricos 


7.1. Introducción 


Los métodos inferenciales analizados en el resto del libro se basaban 
en una serie de hipótesis entre las que se destacaba la de la normalidad 
de las variables. Este enfoque tiene una gran aplicabilidad gracias a la 
distribución aproximadamente normal de la media, cuando la muestra 
es grande. Otras hipótesis, como la de que las varianzas son iguales, 
tienen un peso en la aceptabilidad de los razonamientos desarrollados, 
gracias a la robustez de muchos de los métodos. En toda aplicación es 
importante valorar el efecto de las violaciones en las propiedades de las 
pruebas y en general de los métodos estadísticos utilizados. Recuerde 
que en el ajuste de la regresión el criterio mínimo cuadrático garantiza 
que la recta de regresión sea la mejor aproximación a la nube de pun- 
tos sin tener que utilizar hipótesis distribucionales. Sin embargo estas 
son necesarias para hacer pruebas sobre los parámetros y para la acep- 
tación de que la relación modelada por la ecuación de regresión es 
adecuada. Una solución para asegurar que las violaciones no afectan 
el método utilizado es el estudiar su robustez. Otra es utilizar otro criterio 
que no dependa de parámetros sino de propiedades muy generales. 


Los métodos no paramétricos son utilizados para resolver problemas 
equivalentes a los asociados con medidas de posición, precisión, co- 
rrelación, etc. Ellos sólo requieren de propiedades muy generales 
como la de continuidad e independencia de la distribución de las va- 
riables medidas. Así las hipótesis sobre medias pueden ser sustituidas 
por relaciones similares usando la mediana, por ejemplo. Es posible 
obtener pruebas que pueden ser valoradas como contrapartidas para 
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las pruebas T-Student y F. Por otra parte, la correlación puede ser analiza- 
da a partir de criterios que no requieren de la normalidad para sopor- 
tar la independencia. Adicionalmente hay problemas como la 
aleatoriedad, cuya naturaleza no es caracterizada por parámetros. 
Este es un problema que es intrínsecamente no paramétrico. 


Este capítulo es dedicado a pruebas no paramétricas. Las más 
usuales son presentadas dejando fuera problemas relativamente com- 
plejos, como los de regresión. 


7.2. Tablas de contingencia 


Este es uno de los métodos no paramétricos más utilizados, y es utili- 
zado para estudiar dos problemas sensiblemente diferentes. Uno de 
ellos es aquel en que se toman muestras de tamaño n, de / poblacio- 
nes diferentes y los elementos observados se clasifican en J clases 
disjuntas A,, A,,...A,. En este caso, se trata de establecer si las pobla- 
ciones son homogéneas. 


El otro caso se basa en la selección de una muestra de una población, 
la que es clasificada de acuerdo con dos criterios diferentes: A y B. El 
criterio A se asocia a J posibles resultados mutuamente excluyentes, y 
el B establece que los elementos son clasificables en otras / clases. 
Se desea establecer si A y B son independientes. 


En ambos casos, cada elemento observado es ubicado en una clase 
C, Esta es la intersección de las clases B, y A. Es decir, un elemento 
pertenece a-C, si este es clasificado simultáneamente en B, y A, El 
número de clasificados en ella es n,, La hipótesis a probar en el primer 
caso es describible por: 


H,: La probabilidad de clasificar un elemento en A = p, es la misma 
para todo j = 1,...,J. En el segundo caso, esta es: 


H,: La probabilidad de clasificar un elemento en C, = p, es expresable 
por p, = qp,para todo ¡=1,.../yj= 1... y. 


- donde: 
p= probabilidad de clasificar un elemento en A. 


q,= probabilidad de clasificar un elemento en B.. 
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Los resultados se clasifican, se hace el conteo y se obtiene la Tabla 7.1 
siguiente: 


TABLA 7.1. 
Tabla de contigencia 


E CI 


Se espera que: 


para todo í = 1,..../ y f = 1,...,J. El estadígrafo de prueba es: 


el que se distribuye Chi-cuadrado con (/ — 1)(J — 1) grados de libertad. Se 
espera con una probabilidad 1 — a: que si la hipótesis nula es válida, u 
será pequeño. Por tanto, H, es rechazada si u > x?*(1 —a, [1— 1][U — 1)). Es 
decir, cuando la probabilidad P de observar ese valor es suficientemente 
menor que el nivel q. 


¿ 


- Esta prueba supone que los e,'s no son menores que 5 en ninguna' 
celda. En caso de serlo, es necesario unir algunas para satisfacer esta 
hipótesis. En algunos casos, se puede aceptar que la prueba es utiliza- 
ble, si menos del 20 % de los e's incumplen con esta hipótesis y que 
ninguna sea nula. 


Ejemplo 7.1. En una investigación sobre el efecto de la publicidad por 
Internet en 5 grupos sociales. Se toman muestras de ellos en una 
ciudad y se clasifican los entrevistados de acuerdo con su respuesta 
a un cuestionario donde se evalúa el efecto de ellos en la compra del 
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artículo promovido. La evaluación los clasifica de positivos o negati- 
vos. Los resultados se brindan en la Tabla 7.2 siguiente: 


TABLA 7.2. 
Evaluación de Publicidad por Internet 


Efecto de la publicidad en grupos sociales 
Efecto Efecto 


Grupo Social Positivo Negativo Total 


Solución 


Este es un problema de homogeneidad. 


20-100 
a 
30-100 
81) 00 =15 
30-100 
es) ME =15 


2 2 2 
10 15 15 


Usando a = 0,05 tenemos que x*(0,95 4) = 9,48. Por tanto, no con- 
sideramos homogénea ta valoración que hacen. 


Un ejemplo en el que se evalúa la independencia es el siguiente: 
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Ejemplo 7.2. Se toma una muestra de 1 200 personas y se indaga 
sobre sus preferencias respecto a la programación televisiva. Se for- 
maron 2 grupos de edades y, al clasificar a los entrevistados, se obtu- 
vieron los resultados de la tabla que sigue: 


TABLA 7.3. 
Preferencia de los programas ofertados por la Televisión 


Preferencia por programas de TV 


res | ore | ml 


Use a = 0,1. 
Solución 
Obtenemos la Tabla 7.4 con las frecuencias esperadas siguiente: 


TABLA 7.4. 
Frecuencias esperadas de las preferencias 
de los programas, ofertados por la Televisión 


Preferencia por programas de TV 


2] dores | mo órees | 
ries [ss 


300 (067), 350 (23) 


1 200 “1200 
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y = (68-241,75),.., (83-67,96) _ 2059 
241,75 67,96 


Como y?*(0,9 3) = 6,25 no aceptamos que la edad y la preferencia sean 
independientes. 


En particular, si tenemos / = y = 2, Tablas de 2x2, el estadígrafo de 
prueba se simplifica y debemos incluir una corrección para la disconti- 
nuidad, coeficiente de Yates. Este es: 


Al Ma, = Mam, ) a 


1 ¿M,1M2,M,5 


2 


u= 


Ejemplo 7.3. En la encuesta del ejemplo anterior, se evalúa también si 
se considera como buena la programación que oferta el canal de tele- 
visión que lleva a cabo la investigación. 900 de los jóvenes opinaron 
que no es buena y 170 de los menos jóvenes tuvieron la misma opi- 
nión. ¿Hay independencia? 


Solución 


A partir de los datos suministrados tenemos (ver Tabla 7.5): 


TABLA 7.5. 
Valoración de la programación televisiva 


Jóvenes Total 


Como es una Tabla de Contingencia de 2x2 usamos: 


3 
n 
n ¡(0,12 e Mj10,,) ) 


MA, My 


U = 
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1200.67 -170-63-900)- 
_ 1200/67 -170-63 900) lia 
130-1070 -967 -233 


El percentil x? (0,9 1) = 2,71, por lo que se acepta que no hay indepen- 
dencia, dado que el valor de u posee una probabilidad muy pequeña 
de ser observado. 


7.3. Problemas de una muestra 
7.3.1. Las pruebas sobre la posición 


Al tomar una muestra aleatoria e independiente de tamaño n y medir la 
variable de interés X en ella, obtenemos Ajo LA distribución de esta 
es asumida como continua. 


El problema paramétrico clásico está asociado a la media poblacional 
o teórica. Una hipótesis sobre la media usualmente utilizada es: 


Hu =Uu, 


Podremos considerar que la posición es caracterizada no por la media 
sino por la mediana M y, entonces, plantear el estudio del problema de 
la posición usando: 


A, M=M, 


La mediana M es desconocida y tomamos M, corno un valor hipotético 
de ella. Dada la continuidad de la variable X: 


Prob (X, < M) = 1/2 
Es decir, que sí la hipótesis nula puede ser escrita como: 
H,: Prob (X, < M, ) = Prob (X, > M,) = 1/2 


Sustituyendo la mediana desconocida por su valor hipotético, pode- 
mos definir la variable Bernoulli: 


] si X,2M, 
0 si Xx,<M, 
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Es claro que la probabilidad de que esta tome como valor uno, es 0,5 
si la hipótesis nula es válida. Entonces, dada la independencia: 


Z = pa Z, 
es una variable con distribución B(n, 0,5). Utilizándola, tenemos que: 
A; M>M,vs H :M<M, 


es nuestro problema de prueba de hipótesis y aceptamos H, cuando la 
probabilidad de observar el resultado obtenido es menor que el valor del 
percentil C_ para el correspondiente tamaño de muestra n. Más efectivo - 
puede ser calcular la probabilidad exacta y, si esta es suficientemente 
pequeña, aceptar la hipótesis alternativa. Este cálculo se realiza, como 
es lógico, utilizando la distribución Binomial correspondiente. 


Razonamientos de este tipo nos llevan a no tener la necesidad de co- 
nocer la distribución de X para establecer criterios respecto a la posi- 
ción del centro de su distribución. En el caso normal recordamos que 
la media y la mediana coinciden. Si la distribución no es normal, acep- 
tar hipótesis sobre la mediana no implica que la media tenga una 
comportamiento similar; pero sí ubicamos la posición de una medida 
de teórica de tendencia central. 


El razonamiento anterior nos lleva a poder utilizar pruebas como las 
descritas en esta sección. 


7.3.2. La prueba ordinaria de los signos o binomial 


Si fijando el valor hipotético M computamos Z, obtendremos una suce- 
sión de signos: + si esta es mayor que cero y — si fuera menor. 


Dada la continuidad de la variable la probabilidad de que X sea igual a 
su mediana es cero. Entonces la probabilidad de observar “un + es 
igual a la de obtener un —” y es: 


P(observar un +) = P(observar un —) = 0,5. 


Por eso la prueba es denominada Ordinaria de los Signos. Como Z sigue 
una distribución Binomial también es conocida como Prueba Binomial. 


Cuando la muestra soporta la hipótesis nula, se espera que la variable 
aleatoria asociada al número de signos + sea utilizable para evaluar la 
aceptabilidad de H,. Al fijar a buscamos el correspondiente percentil 
determinando un K, al calcular la distribución Binomial acumulativa. 
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Si H,: M<M, es la hipótesis nula y: 
En 
(0,5) <a 
E) 
tenemos que se puede considerar que se cumple que: 
P(Aceptar H| H,) = P(Z >K')=0 


Por lo tanto, no aceptamos la hipótesis alternativa cuando Z > K, . 
Por su parte si H,: M > M, es la hipótesis nula tendremos que trabajar con: 


05 Y (ss 


y no aceptamos H, si Z > K.. 
En el caso de la prueba de dos colas: 
By M =,j 
y la decisión de rechazarla es soportada por que Z < K,,0Z > K y. 


En particular lo mejor es calcular P(Aceptar H, |.) y si esta es menor 
que a. rechazamos H,. 


Dada la distribución B(n, 0,5) de Z bajo H, si el tamaño de la muestra es 
suficientemente grande para aceptar la aproximación normal: 


E(Z) = nf? =0,5n 
V(Z) = n/4 = 0,25n 


por lo que podemos usar el estadígrafo de prueba: 


PE 
Z* = —2 


Rf 
4 
que es una variable con distribución normal standard y las pruebas se 


basan en los razonamientos ya discutidos en el capítulo correspon- 
diente a las Pruebas de Hipótesis . 


Ejemplo 7.4. Se desarrollan clones de una especie vegetal y se espera que 
las plantas posean una resistencia a una plaga con mediana mayor que el 
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coeficiente del 90.7. Los resultados fueron en una muestra de tamaño 8: 
96,2 67,3 99,2 98,6 955 97,3 79,4 95,2, Use un nivel del 0,05 para 
determinar si se puede aceptar que se incrementó la resistencia de la planta. 


Solución 


Nuestro problema es probar que es cierta H,: M > 90,7. En este caso 
tenemos la sucesión: 


+++ ++ 


por lo que Z = 6 y: 


Ps osx |- 0,1445 


6 


P no es menor que 0,05, por lo que no se puede aceptar que haya 
incrementos. 


Ejemplo 7.5. En una encuesta realizada entre 20 pasajeros se evalúo la 
satisfacción de ellos con el servicio prestado a partir del porcentaje 
que reportaron los entrevistados. La empresa plantea que ella trabaja 
con un adecuado nivel de satisfacción si este es mayor del 50 %. Los 
resultados se brindan en la Tabla 7.6 siguiente: 


TABLA 7.6. 
Resultados de la encuesta de viajeros 


Satisfacción con el servicio de Autobuses 


0,11 0,18 0,21 0,31 0,41 0,17 0,07 0,01 0,22 0,32 0,71 0,10 
0,19 0,25 0,15 0,37 0,33 0,29 0,81 0,91 


Diga qué opina con a = 0,05. 
Solución: 


Dada la información de la empresa, la mediana es 0,5 de ahí que los resul- 
tados se asocian a 3 signos de + y no aceptamos H, :M = M, = 0,5 pues: 


5,20 
Pos» = 0,021 
o K 


pe ar 0,058 


k=0 
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Como Z = 3, el valor observado es menor que K',.. = 5. Por otra 


parte la probabilidad exacta para Z = 3es P = 0,0013. 


Al utilizar la aproximación normal, la que no es exactamente válida, 
pues n < 30, tenemos: 


e 1004 


| 20 
4 
Como la región de rechazo de H, es [-1,64, 1,64 [ este método determi- 
na el mismo resultado. 


Note que esto no siempre ocurre. 


7.3.3. La prueba de los signos rankeados o de Wilcoxon 


En la prueba anterior sólo se considera el signo de la diferencia usan- 
do X ;—M, . Sin embargo, la distancia entre la variable y la mediana 
hipotética no es tomada en cuenta y puede ser importante. Por ello, 
tiene sentido asignarle a cada diferencia un rango tomando en cuenta 
su valor absoluto. Dada la continuidad de X, seguimos considerando 
que el valor cero tiene frecuencia nula. 


Recordando que : 


Rango de |X - M, | = Rango D, = lugar que ocupa al ordenar la 
sucesión D, ,..., D,=R, 


La ordenación es realizada al asignar rango 1 a'la menor diferencia, 
2 a la siguiente y así sucesivamente. Utilizaremos las variables: 


T,= ZiR, 
y los estadígrafos: 


como: 
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Tomaremos para las pruebas a: 
T*=min(1*,T) 
Como: 
Prob (+) = Prob (>) = 0,5 
si la hipótesis nula es válida: 
E(TS)=E(T5)=n (n + 1/4 


Utilizando la distribución de T podemos obtener el percentil T_ corres- 
pondiente para a prefijado en la Tabla de los Signos Rankeados dada 
en el Apéndice. Esta los brinda para muestras de tamaño no mayor 
que 25. La aceptación de la hipótesis H, es el resultado de la prueba si 


T*<T(n,0) 


Para el caso de las dos colas usamos 20. 


Otra variante es calcular la distribución exacta y valorar la aceptación 
de H, si el valor de la probabilidad calculada bajo H, es pequeña. Es 
decir que rechazo H, si: 


Prob(T*2T,)<0 
Para tamaños de muestra mayores que 25 es utilizable la aproximación 
normal. Dado que: 
VUTS = VIT =n (n + D)On + 19/24 
podemos usar como estadígrafo de prueba a: 
q n(n+1) 
en 4 


a 
[nn +1Gn+1) 
24 


que sigue una distribución N[O,1]. Note que podemos usar 7” en esta fórmula. 


Tras hacer algunas transformaciones, obtenemos una forma más sim- 
ple del estadígrafo de prueba que queda como: 


4T*—-n(n+b [3 


E A E 
Jn(n+DQa+1) V 2 
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Ejemplo 7.6. Se evalúa la vida de unos fusibles al someterles a altas 
tensiones en el laboratorio de prueba. Se espera que su mediana sea 
de 800. Los resultados son los siguientes: 


664 1464 76 4829 284 659 847 2402 
Use a = 0,10. 

Solución 

Tenemos H: M = 800 


TABLA 7.7. 
Resultados en la investigación de los fusibles 


: CMA 
vo MOMO MO ECO IS SO EC ESO 
- EJES ES 


En este caso n = 8 y: 


T*=5+8+1+7=21 
T=2+6+3+4=15 


El percentil es 7(8, 0,05)= 4 por lo que no rechazamos la hipótesis 
nula. En este caso: : 


Prob (T* = T,|H, ) = 0,7422 


TABLA 7.7a. 
Valores críticos de T en la prueba de Wilcoxon 


Tamaño de la muestra 
n a/2 = 0,025 0/2=0,01 | a/2=0,05 

A 
a=0,.05 | a/2=0,02 | a/2=0,01 


Ejemplo 7.7. Un médico evalúa en 30 pacientes su comportamiento 
ante un ungúento que debe disminuir significativamente el tiempo de 
recuperación de las quemadas de 2do grado. Este es comparado con la 
mediana de otro medicamento valorado como efectivo. Los resultados 
de las diferencias con la mediana arrojaron los resultados siguientes: 


- 15,0 -18,9 -21,9 -14,2 -15,3 -15,6 -14,9 -15,2 -16,0 -13,8 13,5 
6,7 11,4 2,6 7,6 8,9 5,66 7,8 9,0 2,33 5,0 7,9 11,8 13,6 3,0 
8,8 3,7 8,1 12,7 15,6. 


Diga si acepta que el nuevo medicamento es más efectivo que el que 
existe en el mercado. Use a = 0,01. 


Solución 

En este caso podemos utilizar la aproximación normal. Como: 
E(T+) = 30 - 31/4 = 232,5 
V(T+) = 30 - 31- (60 + 19/24 = 2363,75 


T+ =210 
El valor del estadigrafo de prueba es: 


U= 210-232,5 


/2363,75 


Dado que el percentil de la normal estándar es 2,33 no aceptamos que 
haya mejorado significativamente. 


= 0,464 


7.4. Pruebas para la bondad del ajuste 


7.4.1. Generalidades 


En muchas ocasiones requerimos evaluar si la variable de interés si- 
gue una cierta distribución. En particular el uso de la normal nos lleva 
a tener que probar si los datos siguen esta distribución. 


Un caso muy particular es el de la aleatoriedad. Tomando la equiprobabi- 
lidad de todos los eventos como hipótesis el probar que esto es válido 
soporta la aleatoriedad del fenómeno asociado a estos. 
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El problema se caracteriza por establecer que Xse distribuye de acuer- 
do con una distribución hipotética F(x). Esta constituye la hipótesis nula. 
H, es que esta no es la distribución que sigue la variable X. 


Un grupo de K eventos mutuamente excluyentes es fijado. En parti- 
cular esto es logrado al determinar intervalos usando las técnicas usa- 
das para construir las Tablas de Frecuencias. Las observaciones se 
clasifican en ellas y se computa la frecuencia absoluta n, para cada 
clase C, tal y como se describió en-el Capítulo 1. Si H, es válida: 


Prob(XeC)=P, 
donde P, es computada utilizando la distribución hipotética. Entonces 
si H, es cierta: 

i E (n )J=nP,=e, 


Similarmente Prob (X < q) = F (q) debe ser similar a lo calculado usan- 
do la distribución empírica: 
FE (9= Cantidad de observaciones menores o iguales a x 
Rh n 
En particular, al construir la Tabla de Frecuencias la mayor parte de los 
sistemas estadísticos dan la opción de comprobar si la variable es normal. 


7.4.2. Prueba Chi-cuadrado para la bondad del ajuste 


Tomando e = nP, se establece que la hipótesis de que X se distribuye 
de acuerdo a F,(x) equivale a que al calcular P, usando F, 

H,: E(n ) = nP, para todo í = 1,...,K. 

Por tanto, se espera la validez de esta hipótesis si e ,=n,P,, para todo 
¡=1,.K. 

El estadígrafo de prueba está dado por: 


Ly sa 


¡=1 e; 


el que se distribuye Chi-cuadrado con K-1 grados de libertad. Enton- 
ces, la región de aceptación está dada por [0,y? (K - 1, 1 — a]. Por 
tanto, si u pertenece a ella, aceptamos que F, es la distribución. 

En muchas ocasiones, no conocemos algunos parámetros de F(x) y 
debemos estimarles. Entonces, utilizamos sus estimaciones como 


u 
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sustitutivas de los parámetros desconocidos y estimamos P, mediante p. 
Por ello, en realidad, estimamos e, mediante np, = e*, y el estadígrafo usado: 


sigue una distribución Chi-cuadrado, pero con K-h-1 grados de liber- 
tad si son estimados h parámetros. Los cambios necesarios en la re- 
gión de aceptación permiten hacer esta prueba. 

Note que esta prueba es utilizable para cualquier tipo de variable, e 
incluso, cuando trabajamos con eventos. La única restricción es que 
las esperanzas calculadas bajo H,, e, o e*,, deben ser no menores de 5. 
Esto es paliable al unir clases para garantizar esto. 

En particular, si la distribución es discreta se recomienda utilizar la co- 
rrección de Yates en la que se computa: 


i i i 


Ejemplo 7.8. Se tomó una muestra de 200 adultos y se evaluó el por 
ciento de tiempo que dedican generalmente a la atención de los hi- 
jos. Se desea saber si la distribución de esta variable es normal para 
un nivel del 0,05. Los resultados se brindan en la Tabla 7.8 siguiente: 


TABLA 7.8. 
Tabla de frecuencias del estudio de la atención a los hijos 


Fa P; 


i 


1,75 
24 


213 


E 
Ez 
0 
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Diga si es normal la distribución con a = 0,01. 
Solución 


En este problema no conocíamos la media y la estimamos, así como la 
varianza, usando: 


1= Y %% 2,275 
i=l n 
12 y 
5% = nl X, =X y E 0,22 
i=l Y 


PP E 


n(i-1) ni 
Como las tres últimas clases y la primera poseen menos de 5 observacio- 
nes, hacemos la unión de los intervalos 1 y 2 en uno y, asimismo, hace- 
mos con 10, 11 y 12. Tendremos ahora (ver Tabla 7.9): 
TABLA 7.9. 


Cálculos intermedios para determinar el estadígrafo de prueba 
del estudio de la atención a los hijos 


TRA 
| er, | 93s| 16,45 | 29,46 | 39,99 | 41,99 | 32,03 | 18,90 12,18 


os [o | o77| 101 094 | o [194] om 


Como u = 5,15 y la distribución es Chi-cuadrado con 5 grados de libertad. 
El percentil para 0,99 es 15,1; por lo que aceptamos la normalidad. 


7.4.3. Prueba de Kolmogorov-Smirnov para la bondad 
del ajuste 


Esta prueba es válida sólo para variables continuas. 


La probabilidad Prob (X < x) es computada utilizando la distribución hipoté- 
tica F(x). Esta es estimada por la función de distribución empírica: 


o Cantidad de observaciones menores o iguales a x 
E A AHHH € E AA«:sf ZE 


n 
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Si: 
A, X se distribuye F,(x) 
es cierta, se espera que las diferencias: 
Dto=| F, (9 E, (o) 


sean pequeñas. Por ello, el máximo de estas diferencias absolutas 
D, = Máximo D (x) 


debe ser pequeño bajo H.. 


La distribución de este estadígrafto aparece en la tabla para la prueba 
de una muestra de Kolmogorov-Smirnov del Apéndice, en la que apa- 
recen los percentiles D(n, a) para muestras de tamaños no mayores 
de 35. Se acepta H, cuando D,< Dín, a. 


Para valores mayores se utiliza la aproximación (ver Tabla 7.9a): 


TABLA 7.9a. 
Aproximación para el percentil de la prueba de Kolmogorov-Smirnov 


D (a, 0,01) D (a, 0,05) D (a, 0,01) 


1,63 An 1,36_An 1,22 An 


Ejemplo 7.9. Aplique la Prueba de Kolmogorov-Smirnov a los datos 
del ejemplo anterior. 


Solución 
TABLA 7.10. 


Cálculos para determinar el estadígrafo de Kolmogorov-Smirnov 
para una muestra en el estudio de la atención a los hijos 
a, a, Xx n t, F de Pe D, 
; 8 


4,000 


3,1450 | 099917 | 0,99 | 0001 | 
3,6780 


ETA 
: 
; 
LEE 
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Dogo = 0,036 como D(200, 0,01) = 1,634200 = 0,364, aceptamos la 
normalidad. 


-7,4,4. Las pruebas de aleatoriedad 
7.4.4.1. El problema general 


- Un problema distribucional particular es aquel en que se desea esta- 
blecer la aleatoriedad. Esta se asocia al concepto de equiprobabilidad. 
Esto permite establecer si hay un patrón de comportamiento que nie- 
gue que el azar gobierna el fenómeno. Las pruebas que analizaremos 
están asociadas a la prueba Chi-cuadrado y las rachas. 


El uso de la prueba Chi-cuadrado de la Bondad del Ajuste ya se comentó. 
Una racha es definida como sigue: 


Definición 7.1. Una racha, runfla, corrida o serie es una sucesión de 
símbolos iguales que es precedido o precede otra serie de símbolos 
no similares o por ningún otro. 


Así, si tenemos en la sucesión +++-—+-+++ hay 5 rachas: 3 de 
simbolos + y 2 de símbolos —. 


La aleatoriedad es una de las hipótesis más usadas del arsenal de pre 
requisitos para garantizar la efectividad de los métodos estadísticos. 
En particular, en el estudio de Series de Tiempo y de la Regresión es 
necesario incluso establecer si esta es válida para poder contiar en los 
análisis descriptivos. Al estudiar una Serie de Tiempo interesa saber si 
no hay aleatoriedad para dar razón al uso de métodos para determinar 
la existencia de ciclos, tendencias y otros movimientos. En la regresión 
se espera que los residuos, al ser ordenados temporalmente, deban 
exhibir un comportamiento aleatorio. 


A continuación se brindan las pruebas correspondientes. 


7.4.4.2. La prueba Chi-cuadrado 


Esta es realizable sencillamente al asignar a cada C,, en la prueba de 
Bondad del Ajuste, la probabilidad P,= 1/K. 
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Ejemplo 7.10. El número de fallas de un proceso es considerado alea- 
torio. Se tomó una muestra y se obtuvieron los resultados siguientes 
(ver Tabla 7.11): 


TABLA 7.11. 
Frecuencias observadas en el estudio de las fallas de un proceso 


- OIEA EOS 
. 


Solución 


Como hay 10 categorías, la probabilidad es de 0,1 y la esperanza 
bajo H, es 25 pues n = 250. El valor del estadígrato es: 


_ (36-25 -0,5)+(30-25 0,57 +---+(20-25-0,5) 


= 23,3 
25 


El valor del percentil para 0,95 y 9 grados de libertad es 16,9, por lo que 
no aceptamos la aleatoriedad. 


7.4.4.3. Las pruebas basadas en Rachas, Runflas o Corridas 


7.4.4.3.1. La relación entre Rachas y Aleatoriedad 


La aleatoriedad es caracterizada por el número de rachas, el largo de 
estas y por propiedades de este tipo. Por ejemplo, si observamos: 


es presumible que no hay aleatoriedad, pues hay una tendencia a te- 
ner los + en los primeros lugares. Por otra parte: 


A o 2 
indica que hay un patrón sistemático. 


O sea, que tanto observar pocas rachas como demasiadas es indica- 
dor de no aleatoriedad. 


7.4.4.3.2. La prueba basada en el total de las Rachas 


Consideremos que de los n elementos muestreados n, son del tipo 
caracterizado por un símbolo y n, por el otro. El número de rachas 
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correspondiente a los n, elementos a los que se > identifica con el pri- 
mer símbolo es R, y R, el asociado a la otra ego El total de ra- 
chasesR =R, + A. 


La variable R es aleatoria al seleccionar aleatoriamente la muestra. La 
distribución marginal del tipo de racha 1 está dada por: 


n-1[n-1 


fa (1)= 


Similarmente, podemos denotar la de A, al hacer los cambios nece- 
sarios. Bajo la hipótesis de aleatoriedad, la dea de observar 
R =R,+R, rachas es: 


Fr, (r,)= 


si r es impar 


parar = 2,3...,n. 


La prueba puede ser llevada a cabo al calcular la probabilidad corres- 
pondiente o al comparar r con el valor de la tabla para el Total de las 
Rachas del Apéndice. En ella hallamos dos percentiles para cada valor 
de a, n, y n,. Estos son U'(a, n, y n,) y U(a, n, y n,). Si R se encuentra 
fuera del intervalo [0,0] rechazamos la aleatoriedad. Si se encuentra en 
la cola izquierda, hay muy pocas rachas y si en la derecha, son muchas. 


Ejemplo 7.11. Al estudiar la secuencia de bebés con problemas inmu- 
nológicos en un hospital se obtiene que 5 son hembras y 4 varones. 
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La secuencia tue HHHVVWVHHV. ¿Puede considerarse aleatoria la ocu- 
rrencia de esta disfunción? Use o. = 0,05. 

Solución 

En este caso r = 4 siendo n, = 5 y n,= 4. En la tabla observamos 
que U'(0,05, 5,4) = 2 y U(0,05, 5,4) = 9. Por tanto, la aleatoriedad 
es aceptada. 


Por otra parte, si n, o n, superan a 15 es utilizable la aproximación 
normal a partir de que: 


E(R)=1+ 242 


2n1, (2nm,n) . 


n”(n-1) 


v(R)= 


2n,n,(2n,n, — n) 
nr” (n—-1) 


sigue una distribución normal típica. Entonces, las pruebas normales son 
realizables. 


Ejemplo 7.12. La producción de un taller es evaluada seleccionando 
una muestra de camisas. Estas son clasificadas como aptas para la 
exportación o no aptas. Los resultados fueron: 


AANAAANANAAANNAANAANNNAANAAANNNAAAN 
AANNAAAAANNAAANAAAANNNAAA. 


¿Puede considerase como aleatoria la sucesión observada? Use a = 0,1. 
Solución 


Tenemos 27 rachas divididas en r,= 14 yr,= 13 siendo n,= 38 y n,=22, 
Como n = 60: 


E(R) = 28,87 
V(R) = 12,69 
y: 


Z, = (27.— 28,67)/12,69 = -0,53 
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Para ese nivel, el percentil es 1,64; por tanto, es aceptada la aleatoriedad, 
pues la región de aceptación es ]-1,64 , 1,64]. 


Una forma particular de crear rachas para probar aleatoriedad es com- 
parar los valores de la variable con la mediana de los datos y aplicar la 
prueba con los símbolos + y — obtenidos al evaluar la diferencia entre 
cada dato y la mediana calculada. 


Ejemplo 7.13. Un estudio sobre la respuesta de esquizofrénicos a un 
tratamiento con filmes en los que aparecen mensajes antistress se lle- 
va a cabo con 62 pacientes y se obtienen los resultados siguientes, 
obtenidos con el índice de mejoría establecido en la lista ordenada 
alfabéticamente (ver Tabla 7.12): 


TABLA 7.12. 
Resultados en la investigación de la realción stress-film 


19 21 12 22 23 25 10 29 31 33 45 28 5 34 18 6 11 19 27 1244 
17 6 27 23 2 34 39 31 17 51 3 29 21 7 28 30 12 18 27 32 12 
12 18 17 514 11 29313095 12 11 3524 11 9 14 16 12 


¿Puede decirse que los resultados son aleatorios al nivel del 0,05? 
Solución 

En este caso la mediana es 20 y la sucesión de signos es: 

hh A oo o o ho e o od od do + + 


n,=30 y n,=32siendor, = 14 y r, = 15. Porlo que r = 29, E(R) = 31,96 
y V(R) = 15,21. Por tanto, la aleatoriedad es aceptable, pues el 
percentil es 1,96, la región de aceptación es ]-1,96 , 1,96[, y 


_ 229-3196 


=-0,759 zR =29 - 31,96/3,902 =-0,758. 
3,90 


R 


7.4,4.3.3. Prueba basada en las rachas, ascendentes 
y descendentes 


En ocasiones, nuestro interés se asocia a establecer si hay un cierto 
patrón de comportamiento asociado a que los valores exhiban ten- 
dencias o ciclos. Esto es de particular importancia cuando los datos 
están ordenados en una escala temporal. Observando el número de 
máximos y mínimos relativos en los datos, podemos considerar que 
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antes de ellos observamos una racha ascendente o descendente, de acuer- 
do al caso. Es decir, que tenemos una racha ascendente si observamos: 


po MIO EN 
Podemos identificar esto con que observamos t signos +. Similarmente si: 
XX 22 X,, 


tenemos una racha descendente identificable por una sucesión de 
signos —. En este caso el número de rachas R para tamaños de mues- 
tra relativamente grandes, sigue una distribución normal; pero con: 


2n-1 
E(R)= 
(2) 
á 6n— 29 
, l6n— 
V(R)= 
(R) > 
entonces: 
pr 2971 
tE 3 


Do —_—_—— 
E [ló6n—29 
V 90 


es una variable normal estándar, y podemos utilizar las conocidas re- 
giones de aceptación y rechazo. 

Ejemplo 7.14. El gerente de un hotel evalúa el nivel de ocupación de 
sus habitaciones durante 20 meses y obtuvo los resultados siguientes 
(ver Tabla 7.13): 


TABLA 7.13. 
Ocupación de habitaciones 


¿Puede considerarse como aleatorio el por ciento de ocupación de 
las habitaciones? Use a = 0,05. 


Solución 


El número de observaciones es n = 20. Los máximos en la sucesión 
fueron 73,0; 58,1; 59,0; 42,3 y 53,4. Los mínimos fueron 32,8; 34,0; 
17,8 y 24,3. Tenemos 9 rachas, por lo que: 
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E(R) = 13 
V(R) = 3,23 
y: 


Este valor está en la región de aceptación ]-1,96 1,96[ por lo que acep- 
tamos la aleatoriedad de esa serie. 


7.5. Las pruebas para dos muestras 
7.5.1. Introducción 


Al poseer dos muestras provenientes de dos poblaciones podemos 
estar interesados en comparar si las variables X y Y tienen una distribu- 
ción con una misma medida de posición o si las distribuciones son 
iguales. Observamos: 


20 7 
y: 
Y, Yoo Yo 


El primer caso genera la comparación de medias en el caso 
paramétrico. La correspondiente contrapartida de estas serán anali- 
zadas en forma similar a la desarrollada para el caso de una muestra. 
Hay dos posibles modelos: 


1. Las dos variables se miden en dos elementos distintos al seleccio- 
nar las dos muestras independientemente. 


2. Las dos variables se miden en el mismo elemento en dos ocasiones 
distintas o en elementos idénticos al seleccionar una muestra. 


El primer experimento es conocido como de “muestras independien- 
tes”. En él se trata de evitar que fuentes no controladas de variación 
afecten las respuestas en forma sistemática. El segundo tipo es cono- 
cido como el caso de las “muestras pareadas”. En este caso se en- 
cuentran experimentos en los que se aplica un tratamiento y se mide la 
variable de interés “antes” y “después”. 


Por ejemplo, se toman parejas de esposos, animales de la misma cama- 
da, etcétera. 
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Para el problema de la posición, los métodos también se basarán en 
observar los resultados caracterizables por dos signos o se usarán 
rangos para dar un peso a las diferencias observadas. 


7.5.2. Las pruebas para la posición en dos muestras 
independientes 


7.5.2.1. La prueba de la mediana 


Tomemos M, y M, como las medianas de X y Y. Si estas tuesen iguales 
la relación M, = M, = M es válido decir que: 


P. =P(X<M)=05 


P =P(Y<M)=055 
Entonces podemos definir las variables Bernoulli: 


1 si Xx.>M 
dx) 0 si a 


1 si Y. >M 
Zlv,)> A 
0 si no 
Si unimos ambas muestras, obtenemos la muestra conjunta: 
A E E O 
y estimamos M mediante la mediana de S denotada por M.. Es de 
esperar que sea observada una proporción, que soporte que, el 50 % 


de las observaciones de cada una de las variables Bernoulli tome 
valor no nulo. Las variables: 


U = Número de observaciones de X mayores que M_= 3,” Z(X) 
y: 

V = Número de observaciones de Y mayores que M_= 2,_.” Z(Y) 
tienen la función de densidad conjunta: 


nm 
f(u,v) a ] b: a a 150 Le a E E yaa 
YU LV j j 
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Tanto P, como le son desconocidas; pero se supone que sean 
iguales a 0,5 si las medianas coinciden. Por ello su estimación es: 


_U+v 
N 


dada la hipótesis de igualdad. 
De ahí que bajo la hipótesis nula tenemos la distribución hipergeométrica: 


n m 


Au 


UN 


siendo t el número de observaciones mayores que M, en la muestra. 


U 
f,(u)= 


Entonces las probabilidades necesarias son calculables usando las ta- 
blas de esta distribución. Bajo tamaños de muestra relativamente pe- 
queños, podemos utilizar la aproximación dada por la prueba Chi-cua- 
drado dado que tenemos una tabla de 2x2. El estadígrafo de prueba es: 


2 
N lu(on =v)o vna] -% 
2 
W = 
nmlu +v)(V —u-—v) 
El que se distribuye Chi-cuadrado con un grado de libertad, por lo 


que aceptamos que las medianas son iguales si W > x? (1 — a, 1): Esta 
es utilizable si N =n + m > 20. 


Sin > 30 y m > 30 podemos asegurar la normalidad de las variables 
Binomiales envueltas y hacer la usual prueba de diferencias de propor- 
ciones: 


u v 


n_ m 


Z A CAR AR 
P t tt Y1 1 
1- + 
N Nin m 


Ejemplo 7.15. En dos escuelas diferenciadas se tomaron alumnos 
aleatoriamente. El nivel de aprendizaje obtenido bajo un método de 
enseñanza basado en métodos participativos arrojó los resultados si- 
guientes en la calificación (ver Tabla 7.14): 
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TABLA 7.14. 
Calificaciones con los dos métodos de enseñanza 


70 60 50 25 68 71 41 65 63 35 71 100 
51 16 76 33 90 18 88 78 90 98 76 61 
89 93 87 94 32 69 87 84 10 77 17 85 
19 39 61 76 16 81 83 50 91 69 95 91 
15 69 82 79 71 91 48100 73 71 25 78 
63 88 77 76 77 98 75 94 91 89 17 16 


¿Obtuvieron resultados iguales? Use a = 0,05. 
Solución 


La mediana de la muestra combinada es 75 porlo que n = 35, m = 36, 
N =71,u=20 yv = 15. El estadígrafo de la prueba Chi-cuadrado es: 
| Ty 
71) 20-15 -15-21|-— 


W = = 0,079 
20-15-35-36 


Como yx? (0,95 , 1) = 3,84, aceptamos que son iguales las medianas. 


Podemos usar la aproximación normal. Los estimadores de los 
parámetros envueltos son: 


u/n = 20/35 = 0,571 
vím = 15/36 = 0,417 
t/N = 35/71 = 0,429 
por lo que: 
Z,= OST 0417____ 1,305 
] 


0,429 -0,571 E 
07 00 


y el resultado de la prueba es el mismo, pues este es inferior a 1,96 
que es el percentil correspondiente de la normal típica. 


7.5.2.2. Prueba de Mann-Whitney- 


Esta es básicamente igual a la de Wilcoxon. La muestra conjunta: 
AO a AI O O E 
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es considerada y se calcula para ella la mediana M.. Tomando: 
Rango de |[S,-M,| =R,¡=1,...,N; y: 


2 6 si Sies de la muestra de X 


Osi no 
siendo: 
W/ =Z,R, 
W =(1-—Z,)R, 
entonces: 
N 
w*=3Y w; 
i+l 
N 
W”"=Y w, 
i+l 
usaremos: 


W si n>m 
Dado que la esperanza de la suma de los rangos en cada variable 
bajo H, está dada por la misma expresión obtenida para una muestra: 


es 1) W=w* 
E(W) =¿ m(m+1) W=w" 
2 

y: 

vw) = nmíN +1) 

12 
Trabajamos usualmente con: 
Pa O e 
U = 2 
m(m+1) 


UT" =W" - —__—— en otro caso 
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Tanto U+ como U- toman valores en [0,nm] y su distribución es simé- 
trica respecto a nm/2. La distribución de U es tabulada en el apéndice 
donde obtenemos los percentiles necesarios. La prueba determina la 
aceptación de H, si (ver Tabla 7.15): 


TABLA 7.15. 
Hipótesis nula y reglas de decisión para la Prueba de Mann-Whitney 


RESORT 


Ejemplo 7.16. Se hace una evaluación de películas donde se brindan 
distintos grados de violencia. Esta acción es llevada a cabo a partir de 
evaluar una muestra de adolescentes y exhibirles dos filmes evaluados 
del nivel A y B. Se evalúo cuan agresivamente reaccionaban ante estí- 
mulos auditivos y se obtuvo un coeficiente que se movía en el intervalo 
10-100. Los resultados fueron: 


cima REMITA A 
0 os aja] 


¿Es mayor el índice de la reacción agresiva en el film A? Use a. = 0,01. 


Solución 
Tomando X como la variable asociada al film A tenemos que: 


W=4+6+10+11 + 13+ 14+ 15+ 16= 89 
W=1+2+34+5+7+8+9+12=47 


por lo que: 
= 89 —- 36 = 53 
U- =47-36=11 
U=11 


En este caso, el problema es probar si M, > M, por lo que usamos 
como estadígrafo de prueba a U”. Buscando en la tabla correspon- 
diente del Apéndice, tenemos que U( 0,02. 8,8) = 9 que es menor que 
el estadígrafo de prueba, lo que implica aceptar H, . 
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Si la hipótesis H, es válida: 
E (US = E(U> = nm/2 


V(U9) =V(U)=nm(N+ 12 


Siendo utilizable la aproximación normal si de U* y U- cuando n y m 
son mayores de 8. Entonces el estadígrato de prueba es: 


Ejemplo 7.17. Una empresa productora de quesos desarrolla un nuevo 
queso fundido saborizado con cebolla. La prueba de palatabilidad es 
realizada con dos proporciones del nivel de sabor. Se toman muestras 
entre personas de dos nichos de mercado donde la marca posee altas 
ventas. Los resultados obtenidos se midieron en una escala del 1 al 5 
al hacer un análisis conjuntual. Estos fueron: 


IST 2,5 3,1 2,0 1,1 1,3 1,0 2,1 2,5 2,8 1,2 0,9 0,8 
INEA 1,9 2,9 3,8 0,7 0,2 1,6 0,5 0,6 3,9 


¿Hay un mismo nivel de aceptación en ambos grupos para a = 0,01? 


Solución 


Deseamos establecer si la hipótesis M, = M, es aceptable. La muestra 
conjunta ordenada es: 


0,2* 0,5* 0,6* 0,7* 08 0,9 1,0 11 1,2 1,3 
1,6* 19% -20 72,1 :25 2050-2,B::2,9*:9,1 3,8* 3,9%. 


M. = 1,6, por lo que tomando las mediciunes en el nicho 1 como X 
tenemos que: 


W=5+6+7+4+8+9+10+ 13 4 144 15+ 16 + 17+ 19= 139 
W=1+2+4+3+4+11 + 12+ 18 + 20+21 = 92 
Por tanto: 
| U* =139-66=73 
U” =92-45=47 
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Siendo su esperanza y varianza: 
E (UN =E (U) = 12-92 = 54 


V(U=V(U5)=12-9- 21/12 = 189 
El estadígrafo de prueba para U = U* tiene el valor: 
_ 7354 
189 


Como el percentil para este caso es 2,33; aceptamos que ambos ni- 
chos dan la misma calificación a la prueba de palatabilidad. 


Z, =1,38 


7.5.3. La prueba para la posición en dos muestras 
pareadas 


7.5.3.1. Introducción 


En estas pruebas se supone que las observaciones sean llevadas a 
cabo sobre pares de elementos. Estos deben ser similares. El interés 
es establecer si las diferencias observadas entre la variable medida en 
cada miembro del par tienen un comportamiento que indique la exis- 
tencia de diferencias significativas. 


La muestra está dada por los n pares (X, ,Y,),...,(X, ,Y,). Ella nos permite 
determinar las diferencias 


con las que trabajaremos. 


En la práctica se tiene un problema similar al de una muestra, pues 
observamos n diferencias. Por ello la Prueba de los Signos y la de los 
rangos signados son utilizadas sin cambios significativos. 


7.5.3.2. La prueba de los Signos 


El valor hipotético de la mediana de las diferencias D.,,...,D, es cero. 


lo X,- Y, <0 


O en otro caso 
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y nuevamente podemos obtener una sucesión de signos: + si esta es 
mayor que cero y — si no lo fuera y: 


P(+)=P()=0,5 
por lo que: 
LEE 
sigue una distribución Binomial con parámetros n y 0,5. 


Buscamos el correspondiente percentil al buscar el entero K, más cer- 
cano al valor que satisface la relación que sostiene la aceptación de la 
hipótesis nula usando la distribución Binomial acumulativa. Estas rela- 
ciones son las dadas en la Tabla 7.16 siguiente: 


TABLA 7.16. 
Hipótesis nula y reglas de decisión para la Prueba de los Signos 


donde: 


K 


T 
2=K»z 


es el menor entero tal que (0,5) y e 


2=0 


Ko 
K", es el mayor entero tal que (0,5 yy [js 
Z 


Ejemplo 7.18. Se toma una muestra de un grupo de niños con alu- 
cinaciones. Se someten a un tratamiento pero antes de hacerlo se 
aplica a los seleccionados un test psicológico que da una calificación 
a las alucinaciones. Este es repetido después del tratamiento. Se de- 
sea establecer si estas calificaciones difieren significativamente. Los 
datos obtenidos fueron: 


TABLA 7.17. 
Calificaciones en prueba de Psicometría 


EVO 26,1 12,1 10,0 27,5 15,7 9,7 16,2 32,1 8,2 22,0 30,7 13,2 


ISSUES 24,0 11,2 9,5 25,2 16,8 8,9 17,1 30,1 7,8 22,3 29,3 13,3 
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Solución E 
TABLA 7.18. 


Evaluación de las Calificaciones en Prueba de Psicometría 
“MA (1. 1.0. 0 110010111 


, 


La sucesión de signos obtenidas es ++- -—++-+-+++ y. 


P(Z <8)= e] = 0,927 


por lo que no aceptamos la igualdad. 
Como la distribución B(n, 0,5) tiende a una normal si H, es cierta y el 
tamaño de la muestra es suficientemente grande: 
E(Z)=0,5 
V(Z) =0,25 n 
y nuevamente podemos usar el estadígrato de prueba a: 
n 
y AREA 
7. =L 


n 


4 
el que nos permite probar las hipótesis usando pruebas normales. 


Ejemplo 7.19. Un fabricante de ropa infantil evalúa la calificación que 
los padres de niños menores de 2 años asignan a su oferta de invierno. 
Esos resultados le permitirán orientar su publicidad sesgándola a uno 
de los miembros de la pareja o haciéndola para ambos. En la investi- 
gación de mercado que realizan encuestan a 250 parejas y obtienen que 
las madres le dan una calificación menor que el padre en el 30 % de las 
parejas. ¿La califican más positivamente las madres? Use a = 0,01. 


Solución 


En este problema ya aparece el número de signos de cada tipo. Si 
tomamos la calificación de las madres como X, tenemos que Z = 175. La 
hipótesis de interés es ver si la mediana de las madres es mayor que la de los 
padres: H,: M, > M,. Dado que el tamaño de la muestra es mayor que 30 
175-1 
Le O Sa = 6,32 


E 
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y el percentil para ese nivel de significación es 1,64; aceptamos la hi- 
pótesis alternativa de que las madres la califican mejor. 


7.5.3.3. Prueba de los rangos signados de Wilcoxon 


En esta prueba es necesario calcular el rango del valor absoluto de las 
diferencias D,,...,D,. Tomando: 


T, =Z,R, 


T= Y ZR 
¿sl 


y: 

pe Y 1-Z),R 

¡al 

como: 

T=T*+TT= n(n+1) 
usamos: 

T* = Mínimo ie 
dado que: 


Prob(+) = Prob(—) = 0,5 
4 y nín+l) 
E(r*)= Elr E 
Cuando la hipótesis nula H es cierta. 


La distribución de T está tabulada en el Apéndice, por lo que pode- 
mos obtener el percentil 7, y hacer las pruebas correspondientes 
usando las reglas en la Tabla 7.19 siguiente: 


TABLA 7.19. 
Reglas para aceptar la hipótesis nula en la Prueba de los Rangos Signados 


Si se cumple la relación acepto H, 
TT (am 
T'>T(a, n) 
T<TGa,») 
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Esta prueba es adecuada para muestras de tamaño no mayor que 

25. También podemos calcular la distribución exacta y valorar la 

aceptación de H,. Nuevamente, cuando el valor de la probabilidad 
calculada es pequeña, rechazamos H,. 

La aproximación normal es utilizable para n > 25 reconsiderando que: 

+1 +1 

vv MAA La ) 


tenemos que: 
4T+n(n+1) 13 


Ñ ¿n(n+DQOn+1) 


.es un estadígrato con distribución normal típica, la prueba usual ba- 
sada en la normalidad es utilizada. 


Ejemplo 7.20. Utilice la prueba de Wilcoxon en el ejemplo desarrolla- 
do para la prueba de los signos. 


Solución 
Los datos en ese ejemplo determinaron que: 


TABLA 7.20. 
Calificaciones en Prueba de Psicometría para la Prueba 
de los Rangos signados 


IT 26,1 12,1 10,0 27,5 15,7 9,7 16,2 32,1 8,2 22,0 30,7 13,2 
1 24,0 11,2 9,55 25,2 16,8 8,9 17,1 30,1 7,8 22,3 29,3 13,3 


1D | 2,1 0,99 2.0 0,4 0,3 114 0,1 10 18 0,58 


Tenemos que: 
T'=34+4+6+7+9+10+11+12=62 
T=1+2+5+8=16 


Por tanto, T = 16 y como el percentil para n =12 y a = 0,05 es 17, 
rechazamos H,. 


Veamos otro ejemplo: 
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Ejemplo 7.21. Una cadena de radio hace una campaña de propaganda 
para la mejoría de su programación. Hace una encuesta antes de los 
cambios y después, evaluando los criterios de los mismos radioescu- 
chas. Los resultados fueron: 


130,2 61,6 97,3 105,7 77,7 115,7 47,7 
37,9 76,2 73,4 59,0 89,4 49,2 34,4 58,5 95,4 
119,3 63,3 93,5 101,4 80,2 103,5 


Después 


¿Mejoraron los resultados? Use a = 0,05. 
Solución 


La hipótesis nula en este caso es: M,< M,. Compruebe que T* = 111, 
su esperanza es 68 y su varianza 374. Entonces: 

_ 111-68 

19,34 


= 222 


Como el percentil es 1,64; aceptamos la hipótesis de mejoría de la 
programación. 


7.5.4. La prueba de Kolomogorov-Smirnov 


La comparación de dos muestras independientes puede ser efectuada 
«al comprobar si la distribución de las variables coinciden. Es decir si: 


H.: F(t) = G(t) para todo t. 


Esta es más fuerte que una hipótesis sobre la posición, pues establece 
que las curvas descritas son idénticas. La idea de esta prueba descan- 
sa en el mismo principio de la prueba para una muestra. 


IF(0) — G(Ol= 
para todo t. Entonces, tomando: 
N(t) = Número de observaciones de X menores o iguales que t 
M() = Número de observaciones de Y menores o iguales que t 
F,b) = N(t/n 
G,,p) = M()/m 
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deben ser similares. Por tanto: 
D = Máx. |F, () — G,(0) 


debe ser pequeña. A partir de la distribución correspondiente de este 
estadígrafo, no aceptamos H, si m y n son menores que 25 y: 
K =mnD>Kín, m, 0) 


nm 


donde Kn, m, a) aparece en la tabla correspondiente a la Prueba de 
Kolomogorov-Smirnov para las dos muestras. 


Ejemplo 7.22. El estudio de los lectores de una biblioteca es efectua- 
do para establecer si hombres y mujeres tienen la misma distribución 
de tiempo de permanencia en ella. Los resultados en cinco lectores 
seleccionados fueron: 


Hombres 2,3 48 1,2 0,3 42 


Mujeres 1133 54 3,3 1,9 1,4 


¿Aceptaría que son iguales con a, = 0,05? 
Solución 


TABLA 7.21. 
Frecuencias y diferencias en la distribución empírica de lectores por sexo 


- CEE 
A sas sos [asas fas fijo 
a o] ops] [a fas fas [as] 1] 


D(5, 5) = 2/5 por lo que K(5,5)=5 : 5: 0,4 = 10. En la tabla del apéndice 
obtenemos que: 


K(5,5 , 0,05) = 25, por lo que aceptamos que son iguales. 
Si estamos interesados en una hipótesis unidireccional como: 
F(0) > G(1) 
para hacer la prueba usaría los percentiles de la tabla para este caso. 


Cuando n y m son mayores que 40, la prueba es llevada a cabo 
usando el percentil para el límite de la tabla. 


288 


Ejemplo 7.24. Los incrementos porcentuales de la ventas de un tipo 
de café en tiendas de dos cadenas, después de una campaña publi- 
citaria, quieren ser comparados. Los resultados en la muestras selec- 
cionadas fueron (ver Tabla 7.22): 


TABLA 7.22. 
Resultados obtenidos de los incrementos porcentuales en las ventas de café 


¿Podemos aceptar que difieren icalamento al nivel del 0,05? 


Solución 
Tenemos que (ver Tabla 7.23): 


TABLA 7.23. 
Distribuciones empíricas de los incrementos porcentuales en las ventas de café 


Cota t 


ELO 


G, (0 


[F(O-G(O| 


por lo que D = 0,12. Como para el nivel del 0,05 el percentil es: 


(42, 24) 


D(42.24,0,05)=1,36, ¡Lera 
42-24 


aceptamos que las distribuciones son iguales, pues 0,12 no es mayor 
que el percentil. 


Para el caso unidireccional, podemos utilizar el hecho de que: 


m-n 
m>+n 


u= 4D(n, m,y 


es una variable con distribución Chi-cuadrado con dos grados de libertad. 
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Ejemplo 7.25. La evaluación de los comensales de un restaurante es 
llevada a cabo en varios días de trabajo y de fines de semana. La valo- 
ración de la calidad del servicio fue llevada a cabo usando una escala 
del 1 al 10. Los resultados se brindan en la Tabla 7.24 siguiente: 


TABLA 7.24. 
Distribución de la valoración de la calidad del servicio 


¿Acepta que es mejor la evaluación los fines de semana? 


Solución (ver Tabla 7.25) 


TABLA 7.25. 
Diferencias entre las distribuciones empíricas de la valoración 
de la calidad del servicio 


| 
e, cor MOE ICE O IE 


Entonces D 


1065 = 0,32. Usando la aproximación Chi-cuadrado: * 


u=4D(138,45), papa = 0,68 
: 138445 


que no es significativamente alto, pues no supera a x*(2, 0,05) = 6,64 


7.6. Las pruebas para K > 2 muestras independientes 
7.6.1. Introducción 


Estas pruebas son una contrapartida del Análisis de Varianza. Las ideas a 
utilizar son similares a las de las dos muestras, haciendo las generalizaciones 
necesarias de las Pruebas de basadas en los Signos en los Rangos Signados. 
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7.6.2. La prueba de Kruskal-Wallis 


Esta es utilizada al tener un criterio de clasificación. Teniendo K mues- 
tras independientes, si deseamos establecer si las poblaciones de las 
que proceden poseen la misma mediana, unimos los K grupos en una 
muestra conjunta: 


O O AS A 


Esta es ordenada y determinamos los rangos de cada X;;: 


RR IS 


1 


Se espera que la suma promedio de los rangos de cada grupo sea 
similar, si las medianas son iguales. 


Tomando la variable Bernoulli: 


Ls l si jes de la muestra i 
E 0 en otro caso 


Si la hipótesis de que todas la medianas son iguales es válida, se espe- 
ra que la suma de rangos para el grupo ¡: 


sea similar a: 
n NN+D_n(N+D 
N 2 2 
Por ello, debe ser pequeña para todo la diferencia: 


R_N41_¿ MA 
n 2 E 


Como estadigrafo de prueba usamos a: 


K 


12 Ef. N+1 
PS RI 4 1 > EA il 
a 2 )- A be 
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y rechazamos H, si este toma un valor muy grande. Percentiles para 
la distribución de H aparecen en la tabla correspondiente para esta 
prueba. Si H supera el percentil, no aceptamos H.. 


Ejemplo 7.26. En una visita a un almacén se toman muestras en tres lotes y 
se evalúa el contenido de soja que tienen brochetas enriquecidas con hari- 
na, confeccionadas con este vegetal. Los por cientos fueron (ver Tabla 7.26): 


TABLA 7.26. 
Contenido de soja de las brochetas 


¿Poseen el mismo contenido? Use a =0,05. 
Solución 


En este caso S = (13,2 3,0 2,4 1,4 3,5 3,3 2,7) y los rangos son 7, 
4, 2, 1, 6, 5 y 3. Entonces R, = 13, R, = 7 y R,= 8. El cálculo del 
estadígrafo nos viene dado como: 


las 
= ++ 
a o 


Joas=or 


La tabla correspondiente nos brinda que Hín 
por lo que aceptamos H,. 


¿s0,, 0) = H(8,2,2, 0,05) = 4,71, 


Cuando la muestra es suficientemente grande, H se distribuye aproxi- 
madamente Chi-cuadrado con K-1 grados de libertad. Esto se consi- 
dera válido para K > 5. 


7.6.3. Extensión de la prueba de la mediana 


Si las medianas son iguales en la K grupos, podemos obtener la me- 
diana de la muestra conjunta S, sea m. Comparando cada observa- 
ción con esta es de esperar que el número por debajo y por encima 
de m sea similar en cada grupo. El conteo de ellos nos lleva a una 
Tabla de Contingencia de 2 por K (ver tabla 7.27). 
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TABLA 7.27. 
Tabla de Contingencia para la comparación de las medianas 
de K poblaciones 


Por encima o Por debajo de 
igual a Ms 


Muestra i 


Este estadígrato usual tiene K — 1 grados de libertad, por lo que acep- 
tamos que las medianas son iguales cuando u < y? (K- 1,1 — a). 


7.7. Las pruebas para K > 2 muestras pareadas 
7.7.1. Introducción 


Al comparar K tratamientos en n grupos tenemos una tabla de n filas y K 
columnas. Los elementos de cada grupo son similares y se asigna uno a 
cada tratamiento. Este es el caso de las K muestras pareadas o relacio- 
nadas. Se espera que, dada la homogeneidad de los elementos dentro 
del grupo las diferencias en las respuestas sea debida al tratamiento. 


7.7.2. La prueba de Cochran 


Si tomamos sólo en cuenta los éxitos y los fracasos tendremos una 
variable Bernoulli: 

Lg A si el elemento del grupo t asignado al tratamiento ¡ tiene éxito. 
Z, = 0 en otro caso. 

Se espera la equiprobabilidad de los éxitos y fracasos dentro de los 
tratamientos. 
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Sean: 
C, = Total de éxitos en el tratamiento ¡= Y, _,” Z, 
C = Total de éxitos = »,_ *C 


AS | 
F, = Total de éxitos en el grupot=2,_.*Z, 


j=1 Ti 
La hipótesis de nulidad establece que: 


Q =K(K-1) E, (C-CIKPIKE, y FX, P] 


debe ser pequeño. Este es el estadígrafo de prueba y sigue una distri- 
bución Chi-cuadrado con K — 1 grados de libertad. Por tanto, acepta- 
mos que los tratamientos difieren si Q es mayor que el correspondiente 
percentil. Es decir, si la probabilidad de observarle es muy pequeña. 


Ejemplo 7.28. Un médico quiere establecer si el tiempo de alivio de 
una crisis de asma bronquial de cuatro drogas, las que puede utilizar 
como alternativas, poseen distribuciones con la misma mediana. Se 
tomaron 10 tipos de enfermos crónicos y se midió el tiempo transcu- 
rrido desde el comienzo de la crisis y su alivio. Los resultados fueron: 


Gropo EUENENES 
Droga 2 


¿Es cierta la hipótesis al nivel del 0,01? 
Solución 
En este caso 10 es la mediana y obtenemos la tabla de Z|'s. 


Entonces: 

C = 20/3 = 6,67, 

y: 

Q = 3(2)[(6 - 6,67)? +....(7 — 6,67)? ]/3(20) = 18,19. 


Como el percentil de la Chi-cuadrado x? (2 0,1) = 4,6 aceptamos H,: 
no son iguales las medianas. 


7.7.3. La prueba de Friedman 


Esta prueba se basa en el uso de rangos. Las observaciones hechas 
en cada uno de los tratamientos son rankeados. Esto se repite con los 
n grupos. Se espera que la suma de los rangos asignados a los grupos 
en cada tratamiento sea similar a la esperanza bajo la hipótesis nula, 
que es igual a n(K+1)/2. Tomando: 


R; == R,= Suma de los rangos para el tratamiento j. 
El estadígrafo de prueba es: 
= [12/nK(K + DIZ,. pS 3n(K + 1) 


Tibias para esta prueba permiten establecer si las diferencias obser- 
vadas son significativamente grandes. Como en otras pruebas, acep- 
tamos que las diferencias observadas son significativamente grandes 
cuando F > F(1- a, K, n). 


Ejemplo 7.29. Cuatro grupos de estudiantes con resultados docentes 
similares son entrenados en el uso de bibliografía especializada ha- 
ciendo búsquedas en Internet sobre el tema. Tres enfoques son utili- 
zados en el entrenamiento dado. Uno hace énfasis en los modelos 
matemáticos, otro en el uso de software especializado y el tercero 
hace una combinación de ellos. Los resultados en un examen con el 


mismo cuestionario fueron: 


- Diga si son similares los métodos usando a. = 0,05. 
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Solución 


Al hacer la ordenación obtenemos que: 


Como: 
F = [12/4(3)(4)][81 + 81 + 36] - 3(4)(4) = 1,5. 
El percentil de la tabla correspondiente a la prueba de Friedman es 


F(0,9 5, 3, 4) = 6,5, por lo que no podemos rechazar que los 
métodos generan una evaluación del aprendizaje muy similar. 


Si el número de tratamientos K'es mayor que 5 o n es mayor que 8, la 
aproximación de la distribución de F por una Chi-cuadrado con K- 1 
grados de libertad es aceptable. 


Ejemplo 7.30. Se toman 6 lanzadores de un equipo de baseball y cada 
uno hace 5 lanzamientos utilizando una pelota fabricada por una em- 
presa diferente. La velocidad desarrollada en millas fueron: 


Lanzacior > MEMO ICAO IE ICI INC IC 
Pelota tipo 1 
Pelota tipo 2 
Pelota tipo 3 EDO INCECIN MNETTN MEC IC C 
Pelota tipo 4 
Pelota tipo 5 


Evalúe la similitud utilizando a: = 0,1. 
Solución 
Ordenando y fijando los rangos tenemos: 


Lanzador 
Pelota 1 
Pelota 2 


Pelota 3: 
Pelota 4 
Pelota 5 


Obtenemos que 
F = [12/6(5)(6)][21? + 9 + 22? + 17? + 21?] - 3(6)(6) = 7,73 


En este caso, de nuevo el percentil yx*(0,9, 4) = 7,78; por lo que 
aceptaríamos la igualdad a este nivel, pero no al disminuir a pues 
17 (0,95, 4) = 4,49 y y? (0,99, 4) = 13,28. 


7.8. Medidas de asociación 


Al observar pares de valores en una unidad ¡ obtenemos (X, Y, ), / = 
1,...n. El coeficiente de correlación de Pearson, utilizado en proble- 
mas de regresión, es usado para medir la asociación entre las varia- 
bles. Otros criterios pueden ser usados con este fin. En general, el 
problema de interés es medir la asociación entre X y Y. 

Si tomamos los rangos de ellas y denotamos: 

R, = Rango de X.. 

S, = Rango de Y.. 

El uso de la fórmula del coeficiente de Pearson nos lleva al coeficien- 
te de correlación de rangos de Spearman: 

r5= Ze (R,- 1) (S,- ul,” (R, a 1,Y a ($, Hs "1”=1- 62,," dIn(m—1) 
donde: 

u, : es la media de S; 

u, : es la media de R y, 

ad, =R,-S. 

Este también está entre -1 y 1 y cuando toma el valor cero, decimos 


que hay independencia entre los fenómenos que generan las varia- 
bles. Para valores no muy grandes de 1: 


Per 021731 
se distribuye T-Student con n — 2 grados de libertad. De ahí que la 


hipótesis de independencia sea docimable utilizando r, o r*. 


Existen tablas para evaluar la significación del coeficiente de Sperman 
o utilizando la aproximación de su distribución. 


Un caso particular es el caso en que una de las variables toma sólo 
valores 0 Ó 1. Sea: 


X, = 1 si ocurre A. 
X, = O si no ocurre. 
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Entonces, si Y, es el promedio de las n, unidades de las muestreadas 
donde se obtuvo en la variable X el valor 1. Y, es el de las restantes 
n, = n —n, que toman el valor cero. El coeficiente se convierte en: 


Pys= In, n, In? Y [Y — Y Ys 
donde S es la desviación típica de Y. Este es conocido como coefi- 
ciente Biserial Puntual. 
Cuando ambas variables son binarias tenemos el coeficiente dado por: 


fe A Ys, Xx = 5 X*, Vn, A, nm, n*, 
donde: 
X*, y Y*, ¡| = 0,1, denotan el total de observaciones con valor ¡ en la 
variable correspondiente y: 
pc *k * 
e a Gó 
== *k 

n, =X* +X*, 
O 

== *k 

=X*. + Y 


Este es llamado coeficiente de correlación 6. 


Ejemplo 7.31. Una muestra de 6 adultos jóvenes tue seleccionada y se 
midió el nivel de concentración y de stress. Los resultados fueron: 


Evaluación 


¿Nivel Concentración 


Solución 


Los rangos fueron: 


Stress 
Diferencia 
como: 
E 0d 2 


f 


r.= 1- 6[2]/6(35) = 0,943. 
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Para a. = 0,05 el percentil correspondiente para n = 6 es 0,829, por lo 
que aceptamos que hay una relación significativa entre ambas variables. 


Ejemplo 7.32. Se considera que la concentración, cuando es mayor 
de 90, refleja un adecuado nivel. Al categorizar esta variable tenemos, 
usando los datos del ejemplo anterior, que: 


Mayor 0 igual que 90 7576 


Menor que 90 72 73 711 74 


Diga si es significativa la relación bajo este modelo. 
Solución | 

s = (2, _,* [Y -73,518/5]'? = 1,87 

por lo que: 

Fa = [2(4)/36]'? [75,5 - 72,5]/1,87 = 0,65. 

En este caso no es significativa la relación. 


Ejemplo 7.33. ¿Qué podemos decir al categorizar ambas variables y 
fijar que 76 es un valor alto del stress? 


Solución 


Concentración Alta 
BO E ES A 


SE A A A 


y: 


: r, =[2(4) — 0]/2(4)(4)(2) = 8/64 = 0,12 


Por lo que, al categorizar las dos variables, no podemos aceptar que 
sea significativa. 


7.9. Tratamiento de los empates 


En la teoría se considera que no hay observaciones con los mismos va- 
tores en la muestra. Estos son denominados empates. Sin embargo, es- 
tos son usualmente observados. La razón es el desarrollo de los redondeos 
necesarios al hacer las mediciones. El método más utilizado para resol- 
ver la existencia de empates es asignarle a cada observación ligada en 
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un empate el promedio de los rangos que les pertenecerían. Esto 
afecta la distribución del estadígrato de la prueba, pero no es grave en 
general. Así, si observamos: 


54483565410 1039168410 1111 

Tenemos que hay empate en varias mediciones. Ordenándolas tenemos: 
133444455566880910 10 10 11 11 

y los rangos serían, al no considerar los empates: 
12345678910 11 12 13 14 15 16 17 18 19 20 

Por lo que los rangos a usar serían: 


RIN =1 15 1,5 55 5,5 5,5 5,5 9 9 911,5 11,5 135 13,55 16 16 
16 16 195 19,5. : 


Esto es ajustado automáticamente al utilizar paquetes de programas. 


Ejercicios 


1. Una provincia es dividida en una zona rural y otra urbana. Se toma 
una muestra de personas en cada una y se evalúa el nivel de infor- 
mación sobre los problemas de la provincia. Los resultados fueron 
los siguientes: 


Evaluación/Zona 
| Buena || 1! [| 6 | 
Mata 


Diga si considera que hay homogeneidad en el nivel de información. 


2. Las reacciones ante un estímulo visual se suponen dependientes 
del sexo. Se toma una muestra en un cine donde se exhibió un filme 
con fuertes escenas de sexo. La reacción ante este se evaluó y se 
obtuvo la siguiente tabla de contingencia: 


Sexo/Respuesta 


Diga qué opina. 


20 
10 
30 


MINE AONECTI IENCC 


300 


3. Se quiere demostrar que el grosor de la arena en las playas de la 
costa norte de Cuba depende de la pendiente de la playa. Usando 
o. = 0,05 diga si es aceptable esta hipótesis, si se obtuvo que: 


Arena a 


MERA 
Pendiente 1 fina | Meaia | Gruesa | Chivas Pelos 


4. Se analiza la relación existente entre el índice de machismo entre los 
grupos étnicos y se obtiene que: 


Grupo 
Blanco 

Negro 
Asiático 
Mestizo 


Además, se utiliza el índice de machismo para valorar si hay una 
relación entre este y la esperanza de vida en varios países africanos. 
Se obtuvo que: 


Esperanza de vida/Índice 
METEO IA E 
| Sió0años [| 15 | o | 


¿Cuál es su opinión? 


5. Se desea establecer si la dirección del viento y su fuerza máxima 
son independientes. Se realizaron observaciones de varios días en 
cada dirección y se midió su fuerza máxima. Se obtuvo que: 


| <is ka [so [as | is [19 | | 0] 


Use a = 0,01. 
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6. En una provincia se toma una muestra de 5 000 personas y se evalúa 
su participación en actividades sociales. Su clasificación por sexo fue: 


Sexo 


Hombres BRA 3152 


¿Hay homogeneidad? 


7. Se entrevistan usuarios de un servicio gastronómico. Ellos califican 
el nivel del servicio en Bueno, Aceptable y Malo. Estos son clasifica- 
dos por su lugar de residencia en la siguiente tabla: 


Residencia/Evaluación Aceptable 
Vecindad del establecimiento | 28 | 2 


¿Qué opina usted? 


8. En una encuesta aleatoria entre los clientes que acudieron antes de 
las 12:00 a.m. del día de Navidad se preguntó si acudían por las 
ofertas navideñas o por otros productos. Los resultados obtenidos 
al reportar “si” o “no” fueron: 


ssssnnnsssssssnnssnnnn. 
donde s = sí y n = no. 


Acuden más personas por las ofertas que por la costumbre de uti- 
lizar esa tienda? Utilice a = 0,05. 


Esta encuesta se repitió durante todo el día en otra tienda de la 
cadena obteniendo: 
snsnsssnsnsssnnssssmsnsssnsssnnnsnsssnsnssssms, 

¿Lo es en este caso? 

9. Se toma una muestra de municipios en una provincia y se obtiene 
que los niveles de contaminación, en una escala del 1 al 100, fue- 
ron 19 25 72 81 91 32 81 93 46 67 70 83 10 19 42 57 60 
72 86 90 44 53 65 31 23 75 37 99 50 18 58. ¿Podemos 


afirmar que la situación es compleja si esto es válido cuando la 
mediana es mayor que 50? 
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10. 


11. 


12. 


13. 


14. 


Al analizar la relación nivel de ruido/nivel de stress se obtuvo en 
una comunidad urbana del centro comercial que en las mujeres 
amas de casa esta era: 


0,839 1,025 1,211 0,905 1,065 1,049 1,146 0,936 0,989 0,969 
1,226 0,856 1,033 0,969 1,183 0,920 1,003 0,929 1,259 0,793 
1,111 0,952 1,255 0,855. 


Se dice que hay problemas graves si este es mayor que 0,9. Use 
o. = 0,05 y diga qué cree. 


La evaluación de los desechos de una planta de productos quími- 
cos arrojó las siguientes concentraciones de materias tóxicas por 
cada 100 partes. 


0,17 0,35 0,53 0,70 0,88 1,06 1,23 1,41 1,58 1,76 1,94 2,11 
2,28 2,29 3,01 3,04 3,10 3,17. 


Esta es peligrosa cuando la mediana es mayor de 1,35. ¿Conside- 
ra necesario dar una alarma? Use a = 0,01. 


Los costos de hallar la causa de la falta de control en la producción 
de tabletas son medidos. Se dice que estos son aceptables si la 
mediana de la razón “costo del paro/costo de la producción me- 
dia” no es mayor de 0,09. Las mediciones arrojadas en una mues- 
tra fueron : 


0,087 0,075 0,625 0,391 0,025 0,031 0,124 0,031 0,027 0,038. 


¿Soporta la muestra la hipótesis de que es económico parar la pro- 
ducción para investigar las faltas de control al 10 %? 


Un psicólogo utiliza una prueba para determinar el nivel de agresi- 
vidad de adolescentes con trastornos de conducta. Este es un 
problema social, si este supera el índice de 60. Los resultados de 
la encuesta fueron: — 


51,6 62,6 58,2 45,6 61,4 12,3 57,3 60,2 54,8 78,5 43,2 67,2 
34,2 90,4 65,8 71,2 78,3 89,2 23,1 34,5 76.8 87,2 21,0 56,7 
61,2 21,8 

¿Es un problema social si a = 0,05? 

Se evaluó la diferencia entre el nivel de concentración de una 
enzima y el óptimo esperado, en varios instantes, en una mezcla 
sometida a condiciones medio ambientales no controladas. El 


valor de esta diferencia fue interpolado en una escala de -200 a 
200 y se obtuvo: 
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15. 


¿Puede considerarse que estas diferencias tienen mediana cero 
con un nivel del 5 %? 


Se envía a una muestra de clientes cuatro logotipos alternativos 
para identificar un nuevo tipo de queso que será producido por la 
empresa. Los resultados fueron: 


Logotipo 


Número de 
preferencias 


16. 


17. 


18. 


19. 


20. 


¿Puede considerarse como que hay mayor preferencia por alguna 
de ellas con un nivel del 1 %? 


Se controla la diferencia de stress en un sujeto respecto a la media 
de lo que se espera al utilizar un estímulo visual continuado. El 
experimento es llevado a cabo durante 20 días. ¿Puede decirse 
que tas diferencias son debidas a causas aleatorias si, fijando + 
cuando es mayor y - cuando es menor, obtenemos la serie ++-+- 
— + HA 4 +4? Use or = 0,01. 


Un político realizó una campaña sobre la base de una serie de 
demandas de la población. Al cabo de dos años desea valorar la 
visión que de su gestión tienen sus electores. Él desea establecer 
si puede considerar como aleatorias las evaluaciones. Para ello se 
evalúa la opinión de los electores que están en una cola que se 
hace frente a un teatro y se obtuvieron los resultados siguientes: 


sssnsnsnSANASAANSANASASANSANSSASANNSNSSSNSSNSSSSS, 


en los que s denota la valoración de que cumplió con sus prome- 
sas, y n, que no lo hizo. 


Diga si en el ejercicio 10 considera hay algún patrón que explique 
el comportamiento observado. 


Si en el ejercicio 7 el reporte obtenido fuera en una cola en la 
puerta del establecimiento se acepta la aleatoriedad. 


Haga el mismo análisis con el ejercicio 8. 
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21. Un programa de entrenamiento para perros guías es evaluado. 
Se tomó una muestra de los perros en el plan. Las calificaciones 
obtenidas fueron: 


26, 27, 25, 26, 28, 26, 28, 26 ,24, 23, 22, 24, 24, 23, 24, 27, 25, 26, 
28, 26, 26, 23, 24, 22, 25, 24, 24, 23, 27. 


¿Considera que los resultados son aleatorios con un nivel de signi- 
ficación del 5 %? 


22. En un estudio sobre alcoholismo se evaluó el por ciento de 
absentistas que tenían un alto nivel de alcohol en sangre. Para ello 
se visitaron los trabajadores que no asistieron en una muestra de 
días. de un semestre. Diga si puede considerarse que no hay un 
comportamiento no aleatorio en los resultados al nivel del 5 %. Los 
resultados fueron: 


2,8 2,5 3,1 28 3,0 2,8 33 3,11 35 2,99 3,1 33 3,5 2,7 3,5 3,0 
3,3 2,6 3,0 2,8 3,2 3,1 3,8 2,7. 


23. ¿En el ejercicio 14, es aceptable la normalidad? 


24. La literatura reporta que los niños con trastornos de conducta 
superables poseen una distribución determinada. Se lleva a cabo 
un estudio en una prisión de niños y se desea establecer si ellos se 
comportan de acuerdo con lo fijado. Los resultados y lo reportado 
aparecen en la tabla siguiente: 


wo ENENENEAEAARE 


e 03 021010 


¿Es aceptable lo fijado en la literatura en esta investigación? 


25. ¿Aceptaría Ud. que la distribución en el ejercicio anterior es: 
P[1]=0,08 p[2] = p[S] = P[4] = P[5] = 0,125 P[6] = 0,20 P[7] = 0,22? 


26. Se desea probar si el nivel de aprendizaje de unos estudiantes es 
normal. Los resultados en una prueba de habilidad generó los 
resultados siguientes: 


O 145- | 195- | 145- [.205- | 345- | 395-] 445-| 495-] 545-] 595-| 645- 
195 | 245 | 295 [345 |395 | 445 | 495 | 545 | 595 | 645 El 


vero BETIS RECO RES MECA CA DE A EA 
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27. Se midieron las temperaturas a las 13 horas en Moa durante el 
mes de abril. Se quiere establecer sí esta sigue una distribución 
N[29,2]. Diga qué opina si se obtuvo: 


"Temperatura MAD, 28-29 30-31 — 33 


28. Dos líneas de producción son analizadas. Se toman muestras de 
tamaño 10 en ambas y se mide la calidad de los chips producidos. 
Los resultados fueron: 


Línea 1 1,3 1,2 1,0 0,9 0,7 0,6 1,4 1,3 0,7 0,6 
Línea 2 0,9 0,8 1,7 1,33 1,2 1,0 0,9 0,4 0,7 0,9 


¿Poseen la misma distribución? 


29. En un estudio de mercado se desea comparar la valoración que se 
hace de un refresco de cola. Se toman muestras en dos tiendas por 
departamento, se evalúa el índice de satisfacción obteniéndose que: 


INGEA SS 73 43 21 45 82 55 93 90 10 81 71 81 93 100 


INQMBA 70 43 91 35 22 19 40 32 50 60 


¿Puede aceptarse que los índices de las dos tiendas poseen igual 
distribución si se desea una significación del 5 %? 


30. El experimento del ejercicio 24 se repitió en otra prisión y se quiere 
establecer si las distribuciones coinciden. Diga qué considera uti- 
lizando los datos obtenidos. 


Número de niños 14 24 22 24 20 44 52 


31. ¿Puede decirse en el ejercicio 29 que las medianas son iguales? 
32. Diga si las medianas del ejercicio 28 son iguales al 5 %. 
33. Dos grupos de ancianos son evaluados en función de sus expec- 


tativas ante el futuro obteniendo las calificaciones siguientes: 


Aricianos en asilos 70 86 60 87 50 97 81 95 47 99 89 59 100 98 88 
Ancianos MON EUNiEN 90 83 91 81 87 78 88 40 95 50 96 60 89 93 92 
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¿Poseen igual mediana? 


34. Se someten dos grupos de estudiantes a un experimento peda- 
gógico. El primero recibió deberes extra clases y el otro no. Se 
espera que los que tuvieron tareas tendrán un mejor resultado en 
los exámenes finales. 


Se obtuvo que: 


Grupo control 12 14 14 15 17 19 23 28 
Experimental 15 20 21 23 24 25 27 


¿Es válida la hipótesis de los pedagogos? 


35. El experimento del ejercicio 14 se repitió en otra fábrica y se obtuvie- 
ron los resultados siguientes, en las dos muestras independientes: 


Exp.2  1226122943-711 --43 11 81 --25 83 91 --0,23 923,20 3,42.10,23 


Exp.1 1476715291111 1075189 16 17 1049 92 22780,8117500931 


¿Puede considerarse que tienen la misma mediana al nivel del 5 %? 


36. La evaluación de los desechos de una planta de productos quími- 
cos arrojó las siguientes concentraciones de materias tóxicas por 
cada 100 partes: 
0,17 0,35 0,53 0,70 0,88 1,06 1,23 1,41 1,58 1,76 1,94 2,11 
2,28 2,29 3,01 3,04 3,10 3,17. 


En otra planta se hizo una experiencia similar y se obtuvo: 


12 45 13 056 26 258 0,11 1903 24 56 27 2,8 2,1 
0,3. 4,2 


¿La mediana de la segunda planta es mayor que la de la salados 
Use a = 0,05. 


37. Se desea establecer si la mediana de la contaminación atmosftéri- 
ca en los municipios Cerro y San Miguel son similares. Se toman 
muestras independientes de sitios y se evalúa. Se obtiene: 


Cerro 2,3 34 1,2 7,8 8,2 8,4 9,1 10,3 12,9 3,5 2,4 


SERBIA 1,4 2,3 7,6 7,7 7,9 7,1 10,4 10,7 10,9 4,6 1,4 


¿Acepta Ud. esta hipótesis? 
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38. Se hace un estudio sobre la nubosidad en el mes de enero en la esta- 
ción meteorológica de Casa Blanca y la de Camaguey. Se obtiene: 


0,2 2,4 1,0 1,2 1,5 4,6 0,2 1,1 1,2 1,0 0,5 3,7 
8,6 6,1 1,4 1,33 


Casa Blanca 


er 2.0 1,2 0,1 4,1 6,7 4,2 3,1 0,0 7,8 9,1 1,2 1,4 . 


¿Hay una mayor nubosidad en Camagúey? 


39. El dispositivo de información científica de una institución evalúa la 
posibilidad de utilizar un sistema de primas para elevar el recobra- 
do de materiales. Se tomó una muestra de usuarios y se midió el 
por ciento de recobrado en el tiempo de préstamo entre los que 
recibían el estimulo y los que no. Considera que vale la pena esti- 
mular o no si los resultados fueron: 


Usuarios no 
estimulados 
Usuarios 
estimulados 


72,3 45,6 78,9 23,8 34,7 23,9 78,9 89,5 77,2 


95,6 99,2 89,5 91,2 54,6 24,7 78,2 


40. Se estudia el comportamiento de dos talleres de una planta de 
ensamblaje. El gerente desea establecer si el taller donde se utiliza 
el método de Kanban posee mejores resultados en el control de la 
calidad que el otro que no lo utiliza. Se mide la producción acepta- 
da por el taller de terminado en por ciento. Los resultados fueron: 


Taller 1 


Taller 2 


Utilizando la mediana diga si tienen iguales resultados. 


41. En un ayuntamiento se toma una muestra de parejas con más de 
5 años de matrimonio. Se evalúa su nivel de comprensión ante las 
desavenencias matrimoniales, utilizando un test con calificación 
entre O y 10. Se desea establecer si las mujeres son más com- 
prensivas que los hombres. Los resultados fueron: 


AN 1[2|3|+|s[o6|7|s|9[1w/u|m| 
A as fiapia[] 57] 89] 15) 64]23|33] 
mer EOS EN EEES 


¿Es válida esta aseveración? 
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* 42. En un estudio de mercado se analiza el efecto de dos campa- 
ñas publicitarias en la estructura de compras de un nicho de mer- 
cado compuesto por jóvenes. Una muestra fue seleccionada en 
20 grupos considerados homogéneos, tomándose dos en cada 
uno. Cada miembro del par valoró la propaganda de una campa- 
ña. La calificación se movió entre O y 20 puntos. 


Diga si es mejor la campaña de publicidad 1 si: 


copo ENENENENE E 
o EEE 
07761] 160| 85 15| 60] 152[194[ 15370. 
Melee [s[s|n[s[o[». 
o EEE 
o EEE 


Use la prueba de los signos. 


43, Utilice la prueba correspondiente asociada a los rangos en el ejer- 
cicio anterior. 


44. Se quiere establecer si las tasas de enfermedades cardiovasculares 
y las cerebrovasculares poseen igual mediana. Para ello se toma 
una muestra de municipios y se obtuvo en un año: 


siwnicirtaso EMIERIEN EAN EAN EE 


¿Es mayor la tasa de muertes por accidentes cardiovasculares? 


45. En el ejercicio 37 se deseaba establecer si la mediana de la contami- 
nación atmosférica en los municipios Cerro y San Miguel eran simi- 
lares. Ahora se toman muestras en los mismos días y se obtuvo: 


Cerro 34 28 3,8. 10,44. 7,9 4,5 6,8 3,6: 7,8 0,393 
SPB 46 3,2 9,3 4,55 9,3 6,5 7,0 5,6 8,2 3,1 10,3 


¿Qué usted dice de esta hipótesis? 
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46. Se asignan hombres con la misma sintomatología de decaimiento a 
dos tipos de tratamiento con hormonas. Los resultados obtenidos en su 
resistencia después del mismo en un serie de pruebas fue el siguiente: 


A 12 3 a só 7[819. 
SEN 165 | 241 | 890 | 321 | 245 | 569 | 453 | 333 | 123 | 
a 230 | 240 | 160 | 330 | 200 | 245 
MEC 10 | [213] 1s 115 [16] 17 | 


En 
Tratamiento 1 8] 7] 
rratamiento 2 EUITIO NA EE 


¿Son similares los resultados? 


47. En el análisis del uso de los textos complementarios de una asignatu- 
ra se estableció gue estos no eran utilizados con la frecuencia espe- 
rada. Se introdujo un sistema de tareas que debía propender a un 
mejor uso de la bibliografía. Se tomó una muestra de grupos de cla- 
se. Los resultados evaluados fueron llevados a cabo a partir de un 
coeficiente de uso de la bibliografía que se mueve entre O y 10: 


Curso/Grapo EINEN AT CIA EA 
ames [23 [ss [78 | 89 [92 [12 [3448] 
Después [34] 12] 86 [98] 94] 56] 89 [90] 


¿Qué driría usted? 


48. Las calificaciones totales obtenidas en las pruebas de ingreso por 
los alumnos que aspiran a ingresar en la universidad pueden ser 
influenciadas por el preuniversitario de procedencia. Se tomó una 
muestra de las pruebas y se obtuvo que: 


Preuniversitario Calificaciones 


ATT a A 
O O 


92,3 90,7 50,1 40,9 
75,3 74,2 70,3 


¿Son similares los resultados en las pruebas con un 5 % de significación? 
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49. Se lleva a cabo una prueba de resistencia física para evaluar 4 tipos 
de dieta. Estos se evaluaron en una escala del 1 al 150 y se obtuvo: 


Dieta 1 
Dieta 2 
Dieta 3 
Dieta 4 


¿Aceptaría Ud. que el rendimiento es igual al 5 %? 


50. Jugadores de baseball son asignados aleatoriamente al entrena- 
miento de bateo con tres entrenadores diferentes. Los resultados 
en un serie de 25 juegos arrojó los promedios de bateo listados en 
la tabla siguiente: 


Entrenador 1 195 265 311 302 250 282 280 333 310 
Entrenador 2 230 240 160 330 200 245 285 190 260 
Entrenador 3 "185 295 299 200 340 345 315 238 290 


¿Son iguales los resultados de los entrenadores? 


51. El por ciento de robos a mano armada resueltos en no más de 
una semana es evaluado en una muestra de meses en 5 estacio- 
nes policíacas. ¿Los resultados obtenidos soportan afirmar que 
tienen un desempeño similar al nevel del 1 %? Estos fueron: 


52. La durabilidad del polvo para impresora láser, en semanas, fue 
estudiada en entidades administrativas. Se desea establecer si las 
secretarias hacen un uso similar de sus impresoras. El estudio arrojó: 


Entidad A 4,9 9,5 10,2 11,8 9,7 8,9 
Entidad B A 10,8 8,1 11,4 7,8 


Entidad C 8,6 10,9 9,8 10,7 9,4 11,7 
Entidad D ] 9,6 8,8 10,3 
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Diga qué considera con a = 0,01. 


54. Un psicólogo somete a un grupo de personas con trastornos 
del sueño a un tratamiento de músicoterapia. Se evalúa la 
diferencia entre el nivel previo de insomnio y el que exhiben al 
cabo de 15 días. Se utilizaron 7 compositores y se obtuvieron los 
siguientes resultados, medidos en una escala del -10 al 10: 


Estilo Diferencia 

| Bah | 252334 | 
Wagner 

Strauss |) -13-36-45-38 | 


¿Acepta Ud. que cualquier compositor es adecuado? 


55. Estudiantes de 5 especialidades universitarias fueron sometidos a: 
un prueba que establecía su tenacidad ante la solución de proble- 
mas abstractos. Una calificación entre 5 y 25 brindaba el test, Diga 
si todas las especialidades desarrollan el mismo nivel de tenacidad. 


Especialidad Índice de tenacidad 


20,0 189 23,9 18,3 
17,6 23,8 2044 


19,4 20,5 218 12,8 117 
13,2 184 119 211 
2394 35 100 


56. Existen tres métodos para descargar contenedores con carga va- 


riada. Ellos son sometidos a análisis. De ese estudio se obtuvo: 


Métodos 


% de efectividad 
AS A O EEES 


¿Son equivalentes? 
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57. Se desea evaluar el uso de Internet que hacen las distintas catego- 
rías de investigador de un instituto. Se monitorea el porcentaje de 
tiempo que dedican a la búsqueda bibliográfica útilizando este 

- servicio. La evaluación arrojó: 


OTAN 22,1 22,3 22,5 22,8 90,1 40,2 31,5 40,3 50,1 60,3 
[0-1 TEA 22.0 41,2 22,3 20,4 11,2 10,4 15,1 60,7 30,0 0,3 51,3 


AS 223 21.0 0,5 424 31,8 0,7 71,4 55,3 52,3 63,4 88,1 
8 154 113 
TONTA 14,8 45,7 482 0,9 0,1 75,3 19,7 18,8 25,3 29,2 


¿Qué diría usted? 


58. En un estudio sobre preferencias por una tableta de multivitaminas 
efervescente se valoran 3 variantes de sabor. La mediana de la 
calificación asignada fue de 90,3 puntos y se obtuvo: 


W | Sabor2 | Sabor3 
Por encima de 90,31 102 | 34 | 66 | 
Por debajo de 90,3| 200 | 105 


¿Los tres sabores son igualmente aceptados? 


59. La habilidad para modelar matemáticamente se evalúa en una es- 
cala de 80 puntos entre alumnos de primaria. Se tomó una mues- 
tra de niños con alto rendimiento y la prueba permitió computar la 
tabla siguiente: 


IN 23,4 5,2 34,6 23,6 12,8 3,6 12,8 45,6 32,7 56,0 
Zurdos 34,5 75,2 56,9 78,2 68,2 75,2 71,4 32,7 


II 23,5 12,6 10,5 23,7 15,3 8,4 


Diga si ¡es considera con las mismas condiciones naturales usan- 
do a =0,01. 


60. Un empresario desea establecer el impacto de la publicidad en 
la aceptación de una nueva crema hidratante. Este produce ade- 
más jabón de tocador y colonia. Posee en sus archivos informa- 
ción sobre los niveles de venta de los clientes mayoristas de dos 
estados y asume que con la nueva línea aumentarán la ventas 
totales en la misma magnitud en los tres estados. En su investi- 
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gación en la muestra de almacenes, obtuvo que los dirigentes 
anuncian los incrementos porcentuales siguientes: 


Estado 1 24 1,2-2,6 3,3 4,1. .3,6 


- Estado 2 3,1 32 7,3 5,6 114 14,2 


Estado 3 271,5 2,5 34 48 6.8 104 146 20,4 
Estado 4 24 193372 44.32.53 34 


¿Es válida la proyección del gerente? Use a = 0,1. 


61. Se tomó una muestra de la base de datos de tiendas de una cade- 
na en tres meses diferentes y se entrevistaron clientes que caían en 
la misma categoría. Su satisfacción con el servicio fue evaluado y 
se obtuvieron los resultados siguientes: 


Tipo de cliente 1 2 3 4 5 6 7 8 9 10 
Ps Pe 12] 16] 20] 20] 23|20 
ar Jajajaja falefafap>!] 
hiciere [5 [io] 9 [12[12) 14] 16/27[25 [20] 


El gerente supone que Jos niveles de satisfacción son similares. 
¿Qué diría Ud? 


62. Los resultados docentes de los estudiantes sometidos a un cambio 
de programa de estudios son analizados. Se miden las notas obte- 
nidas por ocho estudiantes en los tres exámenes planeados. ¿Pue- 
de decirse que los resultados en los tres denotan que tuvieron el 
mismo comportamiento, si obtuvieron las notas siguientes?: 


Alumno 1 2 3 4 5 6 7 8 
bxomen2 25 3 [re [39 [5] 
kxamen3 | 232 [o 7isi3T2 


63. El conocimiento de la Historia Universal se evaluó en 15 estudiantes 
de Leyes. Cada uno representaba un grupo etario dentro de una 
cierta procedencia social. Diga si acepta que en las 3 universidades 
analizadas sus estudiantes poseen el mismo comportamiento. 
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e 1121319] s[6[7[8|9f10[iu12/13/ 14/15] 
AA 20120] 90 70] 10] 40 [50 | 70] 30] 10] 55| 60] 10] 10] 10] 
A 13 1060] 5030] 6 [60|50]50|70]50|5025| 0 [0] 
AA 9] 50 80] 6s] 20] 60] 70] 60] 70] 0] 60] 60] 50] 50] 5] 
64. Seis expertos evalúan la calidad de 6 revistas y les dan una califica- 
ción entre 0 y 100. Esta clasificación permite establecer el impacto 


de las mismas en el ámbito regional. Los resultados obtenidos son 
los detallados a continuación: 


Revista 


| Experto 2 | 

ies rs jp 
pres popa jaj 
Experto 6 | 77 | 66 | 80 [86 


¿Son igualmente clasificados? Use a = 0,1. 


64. La vida útil de un control ante cambios de voltaje es analizado. 
Ocho lotes son examinados y se someten a pruebas de alta ten- 
sión ante 5 niveles de cambio de voltaje. La diferencia con lo esta- 
blecido en la garantía fue: J 


Lote 1 


Nivel de cambio 1 -100| 
[Nivel de cambio 2| 50 | 70 [70] 
[Nivel de cambio [60 | 30. 30 -10[ 40 [60] 30| 70] 
[Nivel de cambio 4[ 10 [20] 10[ 102030 10|10. 
[Nivel de cambio 5 150 [100] 100100] 75 [150] 


¿Son iguales los controles de todos los lotes ante los diferentes 
cambios? 


65. Se midió la concentración de proteína en una disolución obteni- 
da con cuatro técnicas experimentales. Estas fueron utilizadas en 


315 


tres sustancias midiéndose su estabilidad en una escala del 10 al 80. 
¿Los resultados obtenidos soportan la hipótesis de que los tratamien- 
tos generan los mismos resultados en las tres sustancias? Use a = 0,05. 


- Sustancia 
Experimento 1 


ESpen rimento 2 


ABR TIA EA ECON BETA 
Fesperimento 4] 3] 0] 


67. Cada una de los miembros de seis grupos homogéneos de perso- 
nas han sido sometidas a una de 6 cargas emocionales bien dife- 
renciadas durante su entrenamiento. Estos propenden a que se 
de solución a problemas de control automático en procesos quími- ' 
cos. Se desea establecer si las respuestas son significativamente 
diferentes. La tabla siguiente contiene las evaluaciones. 


Grupo 1 2 3 4 5 6 
85,6 
90,4 ? 
Estímulo 5] 952 | 861 ] 99.1 ] 874] 083 | 9037 


¿Qué diría Ud. si usa la prueba de Friedman? 


68. Es estudiada la disolución de la penicilina en sangre en 9 pacien- 
tes. Se hacen 5 réplicas y se obtuvo el diámetro de las zonas de 
inhibición en milímetros. Estos fueron: 


Paciónte "e 2 3 4 5 


22,5 


¿Son los resultados aceptablemente similares? 
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69. En tres talleres se producen bloques de concreto para la cons- 

trucción de edificios. Se tomaron muestras para evaluar su resis- 

. tencia. La mediana obtenida fue comparada con la de los bloques 
seleccionados de los talleres y se obtuvo: 


: Número de bloques con Resistencia 
Taller ; E 
Mayor que la mediana Menor que la mediana 


Diga si tienen igual resistencia con una significación del 10 %. 


70. Se desarrollan fármacos como alternativa para combatir la psoriasis. 
Se evalúa el por ciento del área de piel que recupera su textura y el que 
mejora su color. Diga si considera independientes los resultados. 


Textura 35 31 17.40 11 53 22 9 27 49 


Color 23 113 17:29 5::21-107: 19732 


71. Se mide la calidad de la salida de una cadena de producción bajo 
dos políticas salariales. El índice calidad/cantidad fue: 


Política 1 115 119 110 117 120 111 116 
Política 2 110 117 109 115 119 116 117 


¿Dependen los resultados del índice de la política salarial? 


72. Se mide la concentración de dos fármacos en el plasma utilizado. 
Se desea establecer si estas están correlacionadas significativa- 
mente. Los resultados fueron: 

Fármaco 1 47 28 39 44 45 33 48 36 
Fármaco 2 41 31 46 36 53 41 43 31 


¿Lo acepta usted? 


73. Diga si en el ejercicio 42 puede afirmarse que el nivel de compren- 
sión de hombres y mujeres se correlacionan significativamente. 


74. Utilice los datos del ejercicio 45 para valorar si las tasas de muerte por 
accidentes cardiovasculares y cardiocerebrales son independientes. 


75. Diga, en el ejercicio 46, si hay independencia al nivel del 1 %. 


76. Se desea establecer si la presencia del ion cloruro de la atmósfera 
baja y la temperatura diaria se relacionan. Los datos obtenidos por 
el investigador se agrupan en la tabla de doble entrada siguiente: 


cloruro/Te sDe ratura 
dl 


BECA LA EA 
AS ET 
EE IAEA ETE 


¿Qué opina usted? Use a = 0,01. 


Respuestas 


1. Al no cumplirse las hipótesis debemos unir Buena y Regular. No 
aceptamos la homogeneidad. 


2. Se acepta la independencia para a. = 0,05. 
6. Son homogéneos para a. = 0,05. 
8. No aceptamos que vengan más por ese motivo. 


Si usamos la aproximación normal tenemos que z = 1,06 por lo 
que la aceptamos. 


9. No. 
10. Sí, es grave. 
13. SÍ. 
14. No. 
15. No, son equiprobables las preferencias. 
17. Al nivel del 0,01 no podemos rechazar la aleatoriedad. 
18. No se acepta la aleatoriedad, por lo que existe cierto patrón. 
19. No. 


20. Si usamos la aproximación normal, tenemos que z = 1,06 por lo 
que la aceptamos. 
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22. Sí. 

24. No. 

25. SÍ. 

27. No. 

28. SÍ. 

31. No se acepta. 

33. El estadígrafo fue 0,53, por lo que consideramos que sí son iguales. 
40. No. 


- 41. Utilizando las pruebas de los signos y la de los rangos se obtiene 
la aceptación de que sí son más comprensivas. 


42. Acepto. 


48. Utilizando la prueba de Kruskal-Wallis tenemos que los rangos en 
la muestra conjunta establecen que: 


Preuniversitario Rangos 


DONAR CONRDR SAR EXE 
7167 


91837 


Por lo que H = 2,32, y aceptamos que los resultados no son 
significativamente diferentes. 


49. H = 11,52, por lo que aceptamos que son diferentes. 

50. Usando Kruskall-Wallis y un 5 % de significación, sí, son iguales. 
55. No. 

59. No. 

61. Acepto que son diferentes al nivel del 1 %. 

62. Son iguales. 


63. La suma de los rangos son 31, 35 y 23 y F = 1. Este valor 
soporta la aceptación de que son iguales. 
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64. Son iguales. 

65. No. 

66. Usando la prueba de Friedman, se rechaza la igualdad. 
67. Hay diferencias significativas. 

68. Usando Friedman, aceptamos la similitud. 


69. Lo que se esperaba era que las frecuencias fuesen: 


Como U = 8,87 y el percentil para 2 grados de libertad para el 90 % 
es 9,21 no podemos aceptar la existencia de diferencias signifi- 
cativas. 


70. r. = 0,8545, que es significativamerte diferente de cero 

71. r,= 0,7232, que es significativamente mayor que cero. 

72. r_= 0,557, que es significativo al 10 %. 

76. No se puede hacer la prueba, pues hay muy pocas observaciones. 
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Capítulo 8 
Análisis Multivariado 


8.1. Introducción 


Las técnicas multivariadas permiten el análisis de las observaciones de 
varias variables aleatorias correlacionadas para un número de indivi- 
duos. Tales análisis son necesarios en muchas de las ramas de la cien- 
cia, en especial, de las Ciencias Sociales y, fundamentalmente, en la 
Psicología, cuando estudia varias variables simultáneamente. En ge- 
neral no es adecuado llevar a cabo una serie de análisis estadísticos 
individuales para cada una de las variables, ya que con ello se ignoran 
las posibles relaciones entre las variables, llevando con esto a falsear a 
veces los resultados, e incluso, a perder información importante. Por el 
contrario, el Análisis Multivariado puede arrojar luz sobre las relacio- 
nes, independencia e importancia relativa de las características o varia- 
bles consideradas y, de esta forma, dar una información más objetiva. 


La literatura recoge diversos métodos multivariados, en los cuales, como 
se planteó anteriormente, se supone que las variables estén correlacio- 
nadas, pero las observaciones sobre los individuos son independientes. 
Generalmente se supone también que el conjunto de variables aleatorias 
que intervienen en el fenómeno posee una distribución normal 
multivariada. Muchas veces estas técnicas son consistentes y útiles aun 
dado que las suposiciones señaladas no se satisfagan estrictamente. 


Entre las técnicas que trataremos en los ejercicios están: el Análisis de 
Componentes Principales (CP), el Análisis Factorial Clásico (AFC), el 
Análisis Discriminante (AD), la Taxonomía Numérica (CLUSTER) y la 
Prueba de Hipótesis de Vectores de Media (PVM). 
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Es necesario destacar que para la utilización de los métodos 
multivariados anteriores es imprescindible emplear los sistemas de 
computación, ya que los cálculos matemáticos a mano son imposibles 
por su complejidad. Entre los sistemas estadísticos computacionales 
más utilizados están el STATISTICA, STATGRAF y el SPSS-PC, todos 
utilizables en microcomputadora IBM compatible. 


8.2. Análisis de componentes principales 


El objetivo de esta técnica es describir y reducir dimensión. La técnica 
consiste en la transformación de las variables consideradas en el pro- 
blema X,, X,,... X, en un número igual de nuevas variables Y,, Y,,...,Y, 
que tienen como propiedades interesantes: 


a) Las nuevas variables Y,, Y,,....,Y, están incorrelacionadas. 


b) Cada nueva variable Y es una combinación lineal de las variables 
originales y recibe el nombre de Componente Principal (CP). 


(Y =aX +29 +... +3, X.) 


Í a ip p 
c) Cada CP se relaciona de modo que Y, tiene varianza máxima, Y, 
tiene varianza máxima sujeta a la condición de estar incorrelacionada 
con Y, y así sucesivamente. 


d) Cada CP absorbe una parte de la variabilidad total, siendo esta par- 
te definida por la varianza de la CP 


La solución de este problema viene dado por el cálculo de los valores y 
vectores propios de la matriz de correlaciones de los datos o de la de 
varianzas y covarianzas. Los valores propios, ordenados descendentemente, 
son iguales a las varianzas de las variables Y, correspondientes. Las prime- 
ras variables acumulan una proporción alta de la varianza de los datos origi- 
nales (valor propio por 100 dividido por la suma de todos los valores pro- 
pios) y estos son los que constituyen las CP y no se tienen en cuenta las 
restantes. Otra forma de decidir con cuantas CP trabajar es por el diagrama 
de la pendiente donde se plotea en un eje cartesiano por la X cada CP y por 
las Y cada valor propio asociado a la CP estos puntos se unen y donde haya 
una caída brusca, a partir de ella, no se toman en cuenta las otras CP 


Ejemplo 8.1. Se desea caracterizar el comportamiento de un grupo de 
adolescentes y para ello se tienen en cuenta las siguientes variables: 


X, Antecedentes penales del padre (sí = 1 y no = 0). 
X,: Antecedentes penales de la madre (sí = 1 y no = 0). 
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: Padre vivo (sí = 1 y no = 0). 

: Madre viva (sí = 1 y no = 0). 

: Retraso escolar(sí = 1 y no = 0). 

: Condiciones habitables (buenas = 1 y malas = 0). 

: Hijo único (sí = 1 y no = 0). 

: Test de habilidades mecánicas (item). 
: Test razón abstracto (item). 

: Test razón verbal (item). 

: Servicio militar general (sí = 1 y no = 0). 

¡a: Ingreso familiar. 
Solución 


Ei PE o 


> 


pr 
= 


pa 
m 


>< > 


Utilizando el Sistema Statistica versión 6.0 se obtienen las tablas y el 
gráfico siguiente: 
Factor Analysis Extraction Principal Component 
Value Eigenvalue % total var. Cumul. Eíig. Cumul. % 
ET EA A A A 
ER a as] 


Extraction Principal Component 
Factor 1 Factor 2 


] Var 


13 
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Plot eigenvalue 


7 
6 
o 5 
2 
S 4 
ENS 
o 
y2 
5-1 
0 
105 15 2.5 3,5 4.5 55 6.5 


Number eigenvalue 


Como puede observarse del gráfico (Plot eigenvalue), es suficiente . 
para el análisis dos CP; también si se observa el % acumulado de la 
variación explicada, este se encuentra por encima del 70 %; luego las 
dos primeras CP acumulan el 83,85 % de explicación del problema. 


-La interpretación de cada componente tiene que ser dada por sepa- 

rado, debido a que son incorrelacionadas, y se consideran variables 
originales importantes dentro de la CP aquellas cuyo valor absoluto 
dividido entre dos sea mayor que la que tiene mayor valor absoluto. 


En nuestro ejemplo la interpretación sería: 


Primera CP: caracteriza el comportamiento de este grupo el hecho de 
que el padre tenga antecedentes penales, que el padre esté vivo y la 
madre muerta, de no haber cursado el SMG y que las condiciones 
habitables no sean buenas. 


Segunda CP: a este grupo también lo caracteriza el hecho de tener 
retraso escolar, buenos resultados en el test de habilidades mecánicas 
y malos resultados en el de razón abstracto y verbal. 


Ejemplo 8.2. Los datos que a continuación se relacionan, provienen de 
6 estudiantes de Facultades de ciencia a los que se les observó el tiem- 
po promedio en horas que dedicaban a las actividades siguientes: 


X,: Sueño. 
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,. Aseo personal. 


X. 

X,: Transporte. 
X,: Recreación. 

X,: Clases. 

Realice un análisis de CP interprete los resultados. 


Solución 


Se utilizó el sistema Statgraf versión 2.1 sobre Windows. Los datos son 
los siguientes: 


NM Sueño Aseo personal Transporte Recreación Clases 
E A 

¡BERCEO RENTO INACIO IEA EA 

EM RAE 

DRECCOA ROEE A EE E O AE 

EA 

Y los resultados de la salida son: 

Analysis Summary 

Data variables: 

Col_1 

Col_2 

Col_3 

Col_4 

Col_5 

Data input: observations 

Number of complete cases: 6 

Missing value treatment: listwise 

Standarizet: yes 


Number of components extracted: 2 
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TABLA. 
Principal Components Analysis 


Component Elvénvale Percent of Cumulative 
Number 5 Variance —Percentage 


3,30903 66,181 66,181 


TABLA. 
Table of Component Weights 


Col_1 


0,500142 0,251134 
Col_5 -0,448885 -0,393146 


A veces también, en vez de realizar la interpretación de las CP obser- 
vando la tabla de los pesos de las componentes, lo que se hace es 
observar el gráfico que plotea esa información y se analiza qué varia- 
bles representan a cada eje, para lo cual ellas deben estar cerca de los 
extremos de dichos ejes. 


Observe en este caso que tanto por el criterio del ploteo de los valores 
propios, así como por el por ciento de variación explicada(91,999), se 
llega a la conclusión de que se necesitan dos CP 


La interpretación sería: la primera componente caracteriza el he- 
cho de que se dedica mayor cantidad promedio de tiempo por 
parte de estos estudiantes a las actividades de sueño, aseo perso- 
nal y recreación, y menos cantidad a las clases. Esto debía ser 
investigado a mayor profundidad, pues al parecer, o bien el plan 
de estudio es muy flexible o esos estudiantes no asisten a clases, 
en fin, este resultado es complejo. 
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La segunda componente se caracteriza por la gran cantidad de tiempo 
promedio empleado en la actividad de transporte. 


Plot of Factor Loadings 


Factor 2 


Factor 1 


Ejemplo 8.3. Se realizó un estudio en un grupo de niños con vista a 
tratar de describir el comportamiento de ellos, teniendo en cuenta que 
nuestras variables en estudio son las siguientes: 


X,: Preocupación familiar ante el estudio del niño (1 si la hay, O si no). 
X,: Disciplina del escolar en el aula (buena = 1, mala = 0). 
X.: Preparación del profesor (buena = 1, mala = 0). 


X : Rendimiento escolar. 


Interprete los resultados si-la salida del Statisrica es: 


Factor Analysis 


Extraction Principal Component 


Value Eigenvalue % total var. Cumul. Eig.  Cumul. % 


a as jm 7 
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Extraction Principal Component 
Factor 1 Factor 2 


CA ASCII ETRE 
EA a 
0] 0 7] 


Solución 


Del gráfico podemos concluir que con dos CP es suficiente, pero ade- 
más ellas dos explican el 95,5 % del problema. 


La primera componente dice que el comportamiento de estos niños se 
caracteriza por la buena disciplina del escolar en el aula y un buen rendi- 
miento académico. La segunda componente se caracteriza por la pre- 
ocupación, en sentido positivo, de los padres de los alumnos. 


Plot eigenvalue 


Ss 
E 


N 
00 


2,2 


Value eigenvalue 
eS 


0,4 


0,5 1,0 1,5 2,0 2,9 3,0 3,5 4,0 4,5 
Number cigenvalue 


Ejemplo 8.4. Se desea caracterizar un grupo de 100 alumnos que cau- 
saron baja docente durante un cierto curso académico, para lo cual se . 
aplicó un análisis de CP donde se obtuvo los siguientes resultados del 
SPSS versión 8.0. Interpretemos los resultados. 


Solución 


Sólo es necesario dos CP pues ambas explican el 95 % del problema y 
su interpretación es: primera CP; lo que caracteriza la baja docente de 
los estudiantes es el hecho de ser mujer y tener poca asistencia a cla- 
ses, poco tiempo dedicado al estudio individual y a la participación en 
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las actividades de la FEU. La segunda CP dice que también caracteriza 
la baja docente el hecho de ser becado, tener buenos resultados en el 
test de habilidad manual y un coeficiente de inteligencia bajo, aunque su 
participación en las actividades de la FEU era buena. 


Inicial Rxtraction Sum 
eigenvalue Squared Loading 


Component % de Var. % de Var. 


Component Matriz 


"Variables Factor 1 Factor 2 


| Hon deesnei]0 J+  | 
asisengia actes] 08] 02 7 
Prarpación Aer FEU] 03 
Tisado el 
IC" MT A 
aprorectameno actórgo 02] 
coetcegs demelgeat ] ]8 
rubias mecánica 03 | 06] 

EME ESA 

INICIA MEC 

DCI ACE 


Extraction method: Principal Component Analysis a 2 component extracted. 
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Note que independientemente del sistema estadístico que se utilice 
siempre la información que se debe localizar es el calculo de los valo- 
res propios y las ponderaciones de las componentes, que son los 
vectores propios, que en la práctica es lo que permite la interpretación. 


8.3. Análisis Factorial Clásico 


A diferencia de las CP las que se basan en la propiedad de la varianza, 
el Análisis Factorial Clásico (AFC) se basa en propiedades de las co- 
rrelaciones. Este análisis consiste en expresar, las p variables del pro- 
blema por medio de un número más pequeño de q nuevas variables 
hipotéticas comunes y de una variable específica para cada una de las 
p variables. 


Supongamos se tienen p variables aleatorias X....., X, con distribución 
normal multivariada (N(0, E)). 


El modelo del AFC es: 
ASE Att LE +, lI<i<p, l<j<q y q<p 
donde: 
f, : factores comunes. 
/, se denominan saturaciones. 


e, :se denomina factor específico (que es un residuo que representa la 
fuente de variación que afecta solamente a las variables X.. 


Los factores comunes y los específicos son variables ficticias y no es- 
tán correlacionados entre ellos ni con los otros. De ahí que en el mode- 
lo se hagan las siguientes suposiciones básicas: 


a) Las q componentes de f son independientes cada una con distri- 
bución N(0,1). 


b) Los e, son independientes con distribución normal con media O y 
varianza específica e, de la variable X. 


c) Las variables f y e se distribuyen independientemente. 


En la práctica, las saturaciones (/) y las e, son usualmente parámetros 
desconocidos que se estiman de los datos experimentales. 
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La varianza de X, se define como la suma de las saturaciones al cua- 
drado en la componente /, es decir, Var(X) =l + d+... +1 pues 
E =LL'+E, esta descomposición también puede da a través 
de R en vez de E. 


Para la estimación de los parámetros desconocidos en la literatura hay 
diferentes métodos. Uno de los más utilizados es el de los ejes o factores 
principales, aunque también está el del centroide de Thurstone y otros. 
Ellos aparecen implementados en los diferentes sistemas estadísticos. 


En muchas ocasiones, para una interpretación más cómoda y práctica 
se realizan rotaciones, las cuales pueden ser de diferentes tipos. Con 
ellas las saturaciones que son grandes, se hacen más grandes, y las 
que son chiquitas, también se hacen más chiquitas, pero las que sus 
valores de saturaciones no son ni grandes ni chiquitas, con la rotación 
se definen en uno de esos sentidos. 


Para la solución de problemas concretos en los que interesa encontrar 
qué hay de común entre las variables en los diferentes sistemas, como 
por ejemplo: Statistica, Statgraf, SPSS, etc., se buscan las saturaciones 
(aunque sean rotadas) y se interpretan. Esta interpretación será mejor 
en la medida en que se conozca más sobre el problema. 


Ejemplo 8.5. (Tomado de Cuadras 1987) 


Se deseaba analizar qué aspectos habían de común en un grupo de 
estudiantes de enseñanza media en una región, a los cuales se les 
observó las notas en las asignaturas siguientes: 


X,: Matemática. 

X,: Ciencias Naturales. 

X,: Francés. 

X,: Inglés (gramática). 

X¿: Sexo. 

Realice un AFC e interprete los jesulíados, 
Solución 

Se utilizo el sistema Statgraf obteniéndose lo ASES 
Analysis Summary 

Data variables: 

Col_1 

Co!_2 
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Col_3 

Col_4 

Col_5 | 

Data input: observations 

Number of complete cases: 8 

Missing value treatment: listwise 

Standarizet: yes 

Factor Loading Matriz After Varimax Rotation 


| 
| Cor 0.984 0,114 


Type factoring : Principal components. 
Number of factor extracted: 2 
Factor Analysis 


Factor , Percent of Cumulative 
Eigenvalue : 
Number variance Percentage 


3,781 74,362 74,36 
1,169 23,392 97,75 


99,97 
99,99 


En este caso, sin ver el gráfico, podemos concluir que hay dos facto- 
res, esto se debe a que se acumula un por ciento de 97,75. 


Además, se puede decir del primer factor que lo común es los buenos 
resultados en las asignaturas de ciencia que obtienen los jóvenes del 
sexo masculino y del segundo factor podemos decir que también es 
común el hecho de tener buenos resultados en las asignaturas de letras. 
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Ejemplo 8.6. La siguiente tabla muestra los resultados de un AFC a un 
test de inteligencia aplicado por Wescherles a nativos de una cierta 
región; se empleó el sistema Statistica y los resultados tueron: 


Factor 
Analysis 


Extraction Principal Á xis Factofing 


F o total Cumul. Cumul. 
Value Figenvalue ; ES a 
var. Eig. Yo 


Extraction Principal Axis Factoring 
Var Factor 1 Factor 2 Factor 3 
Aritmética 0,70 -0,03 
Similaridades 0,01 
Números [069 062 | 010 
Vocabulario 0,22 
Símbolo-dígito 0,22 
Completar figuras [072] 009] 028 
Diseños de bloque 
Arreglos de figuras | 066 [0002 | 016 
[msambie de objetos] 055 [005 | 044 | 


Haga el análisis. 

Solución 

La interpretación de los resultados sería: 

Factor 1: Llamado factor de habilidad intelectual general con los subtests 

verbales del 1 al 6, con saturaciones ligeramente más altas que los 

tests del 7 al 11. 

Factor 2: Es dominado pour la gran saturación del test de números, 

aunque en contraste los sivbtests verbales de información, compren- 
- sión y similaridades y vocabularios entran con más pequeñas pero apre- 

ciables saturaciones negativas. 
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Factor 3: Parece ser una dimensión de ejecución, aunque también 
tiene una interpretación bipolar como una comparación de los test de 
ejecución del 7 al 11, con los subtests verbales de información, com- 
prensión, números y vocabularios. 


Ejemplo 8.7. La siguiente tabla de datos muestra el peso en kg(X,), la 
talla en cm (X,), el diámetro de hombros en cm (X,) y el diámetro de 
caderas en cm (X,) de 10 mujeres. Si se realizó un AFC ¿a qué conclu- 


sión llega? (Se adjunta la salida del Statistica). 


iS 


SS 


NM 


> 


E No) 


Le 


. 
a 
ES 
D 
ÉS 


00 


UU 


LES 
118 


o 
o 


6 


00 
Un 


. 


Extraction Principal Axis Factoring 


cal Eigenvalue % total var. Cumul. Fig. Cumul. % 


Extraction Principal Axis Factoring 


Factor 1 
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Solución 


En este caso un solo factor explica alrededor del 74 % y se interpreta 
como que todas las medidas del cuerpo tomadas de las mujeres en 
general, integran lo común en ellas. 


Debemos destacar que la calidad de la interpretación será superior en 
la medida en que el investigador que use la técnica tenga un mejor 
conocimiento del problema bajo estudio. 


8.4. Análisis discriminante 


Frecuentemente se presenta la situación de identificar o clasificar indi- 
víduos en grupos o poblaciones, dados a priorí, a partir de la informa- 
ción brindada por muestras aleatorias formadas de esas poblaciones. 
Es por ello que el objetivo del Análisis Discriminante (AD) será la clasi- 
ficación de objetos o individuos en determinadas clases o poblacio- 
nes, sobre la base de la observación de diferentes características de 
los mismos. Y está formado por un conjunto de reglas de decisión, que 
permiten clasificar al individuo a través de la información brindada por 
las muestras aleatorias de cada población. 


Consideremos el caso. de clasificar individuos en dos poblaciones II, y 
IT, y el problema sería como decidir si un individuo pertenece a II, óa 
O, sobre la base de las mediciones del vector de variables aleatorias. 


El problema de la discriminación consiste en buscar una función o 
regla de clasificación de las variables consideradas, que permita clasi- 
ficar cada individuo en una de las poblaciones dadas a priori, esta 
etapa se denomina clasificación. El método, que está implementado 
computacionalmente, se centra en analizar si en realidad existen dife- 
rencias entre los grupos, a partir de las variables utilizadas, para lo cual 
analiza fundamentalmente la distancia de Mahalanobis, analiza tam- 
bién la calidad de la función a través del por ciento de bien clasifica- 
dos e, incluso a veces, puede interpretar la función discriminante en 
dependencia del problema. 


Aunque solamente trataremos ejercicios donde hay solo dos pobla- 
ciones, la técnica del AD puede ser extendida al caso donde hay 
más de dos poblaciones. 
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Ejemplo 8.8. Un psicólogo del trabajo desea analizar si puede clasificar 
a los obreros en operadores de alto rendimiento laboral y de bajo rendi- 
miento. Para este análisis se tuvieron en cuenta las variables siguientes: 


X,: Ser decidido y aceptar las situaciones de riesgo (Item). 
X,: Estabilidad del Stress emocional (Item). 
X,: Tiempo de reacción. 


- Se escogió una muestra de 6 trabajadores de alto rendimiento laboral 
y 7 de bajo rendimiento y se supuso además, la normalidad del vector 
de variables y que las matrices de varianza y covarianza fueran iguales. 


Se utilizó un programa de computación de los que existen y se obtu- 
vo la función discriminante siguiente: 


D=-0,01 -0,03X, + 0,002 X, 


Fueron bien clasificados en el grupo1, 6, y en el grupo 2, 4 y la distan- 
cia de Mahalamobis fue de 72. 


Solución 


El psicólogo obtiene que el 76,8 % de los operadores están bien clasi- 
ficados, lo cual indica que la función discriminante D es buena y a 
partir de ella se puede clasificar a un nuevo operador en de alto (si su' 
valor es grande) o de bajo rendimiento (si su valor es pequeño). Tam- 
bién obtengo como información que la Variable X, no es muy importan- 
te para la clasificación. 


En cuanto a Mahalanobis, el valor se analiza como una prueba de hipótesis 
donde en H, (hipótesis nula) tengo que la distancia es cero (o sea no hay 
diferencia entre los grupos a partir de la variables originales), y en la hipóte- 
sis alternativa (H,) tengo la existencia de diferencias, y la regla de decisión 
sería de rechazo la hipótesis nula si la distancia de Mahalanobis es mayor 
que F,_(o,n), donde n es el tamaño de las dos poblaciones, y p la cantidad 
-de variables. En el ejemplo, el valor de F. ..(3,9) = 3,86, luego existe en 


0.95 
diferencias entre los grupos a partir de las variables analizadas. 


El por ciento de bien clasificados se obtiene de la manera siguiente: 


Bien clasificados | Mal ma 


% bien clasificados = 10 (100)/12 = 76,8. 
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Supongamos, en la situación anterior, que se presentan 3 obreros a 

ocupar 2 plazas y el problema es a cuál de ellos se le debe otorgar. 

Para ello, el psicólogo decidió evaluar la función D encontrada en cada 
obrero. 


Obrero 1 D= 1,3. 
Obrero 2 D= 2,1. 
Obrero 3 D = -1,1. 


Evidentemente, en este caso lo lógico es dejar sin plaza al obrero 3 
clasificado de bajo rendimiento. 


Ejemplo 8.9. Se realizó un estudio con 20 niños que estaban divididos 
en dos grupos iguales de 10 niños cada uno. El grupo 1 era el de los 
niños que tenían una cierta aptitud (se le asignó valor 1) y los niños del 
grupo 2 no la tenían (se le asignó valor 0). 


El objetivo que se perseguía era encontrar una función que permitiera cla- 
sificar a nuevos niños en esos grupos a partir de las variables siguientes: 


X,: Resultados de un test (escala de la prúeba de 0 a 7 puntos). 
X,: Si le gustaba desarrollar esa actividad (sí = 1 y no = 0). 
Se utilizó la salida del Statistica que es la siguiente: 


Squared Mahalanobis Distance 


A 


P_levels 


ns es ea E 
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Classification Matriz 


Observe, en este caso, que la distancia de Mahalanobis resulta signi- 
ficativa con a. = 0,05 y que la calidad de la función discriminante .es 
buena; además, la función discriminante que se obtuvo tue: 


D = 2,63 - 0,73X, - 1,12%, 


8.5. Taxonomía numérica (Cluster Análisis) 


Estas técnicas se utilizan para dividir o separar un conjunto de datos 
en diferentes tipos o grupos, y la división puede hacerse por variables 
o por individuos. Esto se hace partiendo de los datos a los cuales se 
les calcula sus índices de similaridad o de disimilaridad (distancia). 


Hay diferentes técnicas de cluster y una de las más utilizadas son las 
técnicas jerárquicas aglomerativas, cuyo resultado concluye con la cons- 
trucción de un gráfico llamado dendograma o árbol de clasificación. 
Ahora, dentro de estas técnicas hay diferentes métodos para la agru- 
pación, entre ellos se encuentran: el método del vecino más cercano, 
el del vecino más lejano y el del promedio, entre otros. 


Los pasos del método del vecino más lejano son: 


1) Se parte de una matriz de disimilaridades o de similaridades de los 
datos. e 


2) Se analiza la menor distancia (a) y se fusiona el grupo (i,/) como un 
solo grupo. 


3) Se calcula la distancia entre grupos, que se define como la distancia 
entre sus miembros más lejanos (d, ,,, = máx. (d,, d,)). 


En el método del vecino más cercano se dan los mismos pasos ex- 
cepto el 3) en el cual se calcula la distancia entre grupos como la 
distancia entre sus miembros más cercanos (d,,, ,, = mín. (A, , d;))- 


Ejemplo 8.10. Aplique el método del vecino más lejano y construya 
un dendograma a partir de la siguiente matriz de disimilaridades de 
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5 variables. Estas variables pueden ser diferentes manifestaciones de 
las ETS (Enfermedades deTransmisión Sexual). La matriz es la siguiente: 


02.610 9 
05 9 8 

D= 00.4 5 
0 3 

0 


Solución 


Como la menor distancia es 2, que ocupa la posición 12, es decir fila 
1 y columna 2 el primer grupo que se une es el (12) y en ese sentido 
se calcularía 0, , 3, is 2 4 Y Das: 


Aa = MÁX. (0, ¿, 0d, ,) = máx. (6, 5) = 6 
Ae 2) 4 = MÁX. (A, ,, 1,,) = máx. (10, 9) = 10 
A 29 = MÁX. (d, ¿, d,5) = máx. (9, 8) = 9, y queda la nueva matriz: 
0.56 109 
0.4 2 
D=]. e 
0 3 
0 


Ahora, la menor distancia es 3, que ocupa la posición 35. 


Airoyas, = MÁX. (0, 7, 4: 0 Mea máx. (10, 9) = 10. 
As das = MÁX. (0, y, O, , = máx. (4,5) = 5 y la nueva matriz es: 
0.6 10 
D= 0 5 
0 


Por último, el menor valor es 5, luego se unen (12)(3(45)) y la matriz 


que se forma es: 
h A 
D= 
0 
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El gráfico que resulta es: 


¡0 


l 2 3 4 5 


Se puede observar que hay 2 grupos definidos a partir de las va- 
riables, el formado por las variables 1 y 2, y el formado por las 
variables 3, 4 y 5. Esto indica que en las características seleccio- 
nadas en el estudio de las ETS hay presente 2 tipos diferentes de 
enfermedades de las ETS. 


Este estudio pudo plantearse en el sentido de buscar grupos, pero 
entre los individuos. 


Ejemplo 8.11. Se seleccionaron seis facultades de una Universidad don- 
de a cada una se les observó dos características o variables X, y X,, 
con el objetivo de analizar si dichas facultades se agrupaban teniendo 
en cuenta esas variables. Los datos son: 


Solución 


Si utilizamos el método del vecino más cercano y además nos auxiliamos 
del sistema Statistica, y si usamos la distancia euclidiana obtenemos: 
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O 141 316 4,47 3,61 2,4| 
0 2 424 412 2,24 
0 316 412 2,24 


D= 
O 2724 2,24 
0: 2 
0 


Tree Diagram for 6 Cases 
Single Linkage 
Euclidean distances 


Linkage Distance 


1,3 


C6 CS C4 C3 ade C_1 


Podemos concluir que hay dos grupos de Facultades en esa univer- 
sidad, las que forman; A, B y C(c_ ,,C_ ,y C_¿) y las que forman D, E 
y FlC_,C0_sYC_). ; 


- 8.6. La prueba de hipótesis de medias 


Esta técnica es similar al Análisis de Varianza univariado y lo que intere- 
sa analizar es si existen o no diferencias significativas entre los vectores 
de medias. En este análisis se parte de la suposición de que X (vector) 
distribuye normal con vector de medias u y matriz de varianzas y 
covarianzas X(N(u , E) ). Aquí se presenta el problema de analizar cómo 
es *, si conocida o desconocida. 
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Sólo trataremos el caso de 2 desconocida pues, en realidad, este caso 
es el que presenta interés, desde el punto de vista práctico. 


Las hipótesis de interés pueden ser de dos tipos: 
1) A. =U, H,: 1, %*H, donde y, es conocido. 


2) HA. 4, = , H,:u, hu, donde y, y 1, son vectores de medias 
desconocidos. 


La solución sería obtenida utilizando los estadígrafos en el caso 1) como: 
F¿= [(n-p)/p(n-1)]]T* yT?= n(X- 1,)' S” (X- 1,) y a T? sele 
conoce como el estadígrafo de Hotelling y S es la estimación de 
la matriz de varianzas y covarianzas. Se rechaza la hipótesis 
H,SiF,>F, (0, N-p)yN =N, +N,. 

Para el otro caso, el 2), la solución sería: 

F = [(N, + N,-p-= 1) / p(N +N,- 2] 7? 

donde: 

P = [NN (N + N)] (XX) S,* (X,—Xo) y, 

S, = WN, +N,- 2)[ (N, — 19S, + (N, — 1)S,]. 

Rechazamos la hipótesis H, si F, > F, (Pp, N, + N,— p— 1) y tanto S, 


como S, son las estimaciones respectivas de las matrices de varianzas 
y covarianzas de cada vector de variables. 


Ejemplo 8.12. Se desea comparar 15 pacientes, a los cuales se les ha 
tomado la presión en sístole y diástole, y provienen de una población 
de pacientes con presión promedio de 120 en sístoles y 80 en diástoles. 


Se aplicó un programa de cómputo a los datos obtenidos y se obtuvo 
T? = 0,4. Diga qué hipótesis se desea probar y a qué resultados se 
llegan. 


Solución 


Supongamos que el vector X = (X,, X,)' distribuye normal multivariado 
y que tomamos a = 0,05 y sabemos por datos que 


M, = sd luego las hipótesis en mi problema son: 


120 120 
ES vs H, ¡444 = [50 77 yp=2 
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= ((15 -— 2)/[2(15 — 1)130,4 = (13/28)0,4 = 0,09 


E. (2 13) = 3,80 y como 0,09 < 3,8 entonces, no rechazo H,, luego 
todo parece indicar que los pacientes provienen de una población con 
presión promedio de 120 con 80. . 


Ejemplo 8.13. Un investigador desea a mediante un estudio 
experimental, que los distintos sistemas de reacción de el organismo 
de los choferes se alteran según la cantidad de alcohol ingerido. Para 
ello se les suministró dosis pequeñas de alcohol a 6 choferes midiendo 
las distintas reacciones de los mismos en un simulador; mientras que a 
otro grupo de igual cantidad de choferes se les suministró altas dosis, 
procediendo de igual forma. Se midieron 10 tipos de reacciones. 


Plantee las hipótesis del problema y si se calculó el 7? = 31,6 a partir 
de los datos auxiliares de una computadora. ¿A qué conclusión se - 
llega? Utilice a = 0.05. 
Solución 


Sea y, el vector de media de las reacciones de los choferes a quienes 
se les suministra bajas dosis de alcohol! y u, el vector de media de las 
reacciones de los choferes que se les suministra altas dosis de alco- 
hol, las hipótesis son: 


H.: 4, =M), VS Au, 44, 
F, =[(6 + 6-10 -— 1)/(12 — 2)10]31,6 = 0,316 como F,..(10,1) = 242 


0,316 < 242 entonces no rechazo H, y podemos concluir que las 
reacciones del organismo se comportan igual, tanto suministrando 
altas dosis que bajas dosis. 


sá 


Ejemplo 8.14. Los componentes de 20 portafolios fueron evaluados 
durante un año y se obtuvieron las ganancias porcentuales siguientes: - 


rorstoos - MEVA E MECA CO EA AC CA E A IES 


Aviación 16] 16|27|20/|33| 22 
O 11112 13 | 14/15) 16/17 |18| 19 | 20 | 
Constructiva 7,2 | 3,8 5,6 
Electrónica 1244) 155 
sición COPE ENEE 
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¿Puede decirse que estas lecciones tienen una ganancia media de 
[5,25,2]? 


Solución 
1? =9,74 y [k(n- 1)/ (n-k)] y; (0,1) = 8,18. Entonces acepto H.. 


Los sistemas estadísticos más difundidos en el país y que pueden 
ser utilizados en los diferentes temas tratados son Statistica, Statgraf, 
Spss y Sas. 


8.7. Métodos gráficos multivariados 


No se debe culminar este capítulo sin antes comentar algo sobre los 
métodos gráficos multivariados, debido a que en ellos el especialista 
no matemático encuentra con frecuencia problemas de su especiali- 
dad, y empleando estas representaciones gráficas, logra ganar en in- 
formación y claridad visual en su problema. Por ello comentaremos 
brevemente algunos de los métodos gráficos multivariados, los cuales 
con ayuda de la computación, resultan fáciles y cómodos de hacer, 


Modernamente, los métodos gráficos se emplean en la fase exploratoria 
del análisis de los datos, aunque este no es su único uso, puesto que 
se emplean también para la comunicación y presentación de los datos 
y para la confirmación de los mismos. 


Dentro de los gráficos multivariados tenemos a los perfiles, glifos, 
estrellas y caritas de Chernov. No explicaremos cómo se constru- 
yen a manos, puesto que aparecen implementados en los módulos 
gráficos de los sistemas profesionales mencionados a lo largo del 
capítulo, y sólo destacaremos que las caritas de Chernov apare- 
cen en el Statistica, uno de los sistemas más completos en la parte 
gráfica multivariada. 


Lo anterior lo ilustraremos con ejemplos y aunque dejaremos pro- 
puestos sólo dos ejercicios, sugerimos que siempre se realicen estos 
análisis gráficos antes de utilizar alguna técnica multivariada de las 
planteadas en el capítulo. 


Ejemplo 8.15. Usando la tabla de datos del ejemplo 8.2 y utilizando el 
sistema Statistica se obtuvieron los siguientes gráficos brindados. Ana- 
lícelos y diga qué información resulta de cada gráfico. 
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Solución 


Del gráfico de perfiles de barras se puede observar que si los casos, 
que son los individuos, representan diferentes Facultades, la no. 6 es 
la que más tiempo promedio en horas dedica a la actividad del sueño 
y a la recreación, pero además en general se dedica mas tiempo pro- 
medio a la actividad del sueño y a las clases y poco tiempo promedio 
se emplea en general en el aseo personal. 


En las caritas también se observa esta información, pero además se 
evidencia que cada facultad se comporta en cuanto a las actividades 
de forma diferente, al pie del gráfico esta lo que significa cada rasgo de 
la cara en comparación con las variables. Al parecer la Facultad no. 2 
es la que mejor se comporta. 


Data: cap8.STA Sv*6c 
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Data: cap8.STA Sv * 6c 


L Ns) 

A ES ed Ñ / 
Case 1 Case 2 Case 3 
Case 4 Case $ Case 6 


LEGEND: face/w = SUEÑO, car/lev = ASEOP, halffaceh = TRAN, upface/ece = RECRE, 
loface/ece 7 CLASES, 


El tercer gráfico es el de estrellas, donde cada punta representa una 
variable. Su interpretación no esta muy clara, sólo puede afirmarse 
que todos los casos difieren. Aquí resulta que se ve mejor la informa- 
ción en el gráfico de las caritas que en este de estrellas, y el problema 
consiste en que entre más variables haya en el gráfico de estrella, más 
difícil resulta obtener información de forma clara. 


Data: cap8.STA 5v*6c 


is Y 3 

Case 1 Case 2 Case 3 
i | 

Case 4 Case 5 Case 6 


LEGEND (clockwise): SUEÑO, ASEOP, TRAN, RECRE, CLASES 


Ejemplo 8.16. De la tabla de datos del ejemplo 8.7, y utilizando el siste- 
ma Statistica, se dibujo el gráfico de las caritas. ¿Qué información se 
puede obtener del mismo? 
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Data: lab.STA 4v*10c 


pá ; ee 


Us A 


Case 3 Case 4 


Case l 


Case 9 Case 10 
LEGEND: face/w = PESO, ear/lev = TALLA, halfface/h = DIANH, upface= DIAMCAD. 


Solución 


De este gráfico, donde los casos son mujeres, se puede decir que las 
hay gruesas en su mayoría, puesto que el rostro lo representan talla y 
peso, y sólo la no. 2 y la no. 9 son delgadas, aunque se debe destacar 
que son medidas de mujeres que parecen ser criollas, pues todas 
tienen diámetro de cadera amplio. 

En este ejemplo también podía haberse analizado otro tipo de gráfico 
de perfiles, como aparece a continuación. Observe los resultados que 
se obtienen similar, a los de las caritas. 


Data: lab.STA 4v * 10c 


Case l Case 2 Case 3 


o Lia E 
OS 
SS pe Su A N 
Case 9 Case 10 


LEGEND (left to right): PESO, TALLA, DIANH, DIAMCAD 
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8.8. Ejercicios ' 


1. En un estudio sobre el rendimiento laboral de operadores de maqui- 
narias se midieron las variables siguientes: 


X.: Toma de decisión y aceptación del riesgo (item). 

X,: Estabilidad emocional (item). 

X,: Velocidad de respuesta (item). 

X,: Rendimiento laboral (item). 


Se deseaba caracterizar el comportamiento de los mismos, para lo 
cual se utilizó el sistema Spss y se obtuvo la salida siguiente: 


| Inicial eigenvalue 


Rxtraction Sum 


REN 
PO E A Se 100 


Component % de Var. Cum %. % de Var. 


Component Matriz 


Variables Factor 1 


Extraction method: Principal Component Analysis a 2 component extracted 
Analice esta salida. 


2. Se llevó a cabo un estudio en el cual se quiere tratar de explicar las 
causas que motivaron la presencia de amnesia en un grupo de suje- 
tos. Se recogió una muestra de 10 sujetos amnésicos y se midieron 
las variables siguientes: 


X,: Cantidad de objetos memorizados por los sujetos. 
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X,: Accidentes tenidos por los sujetos. 

X, Resultados obtenidos en el test de inteligencia. 

X,: Resultados obtenidos en el test de aprensión y fijación. 
Interprete los resultados si se tiene la siguiente salida del Statistica. 


Factor Analysis Extraction Principal Component 


Value Eigenvalue % total var. Cumul. Eig. Cumul. % 


EA as as as] 


Extraction Principal Component 
Var. Factor 1 Factor 2 
0.443 


--0,0167 
-0,0350 -0,5230 


3. En un estudio con los alumnos de primer año de una carrera universi- 
taria, el investigador quería corroborar la presencia de tres factores. 
Se aplicó un AFC y se obtuvo, del sistema Statistica, los resultados 
que aparecen a continuación. Interprete los factores hallados: 


Factor Analysis Extraction Principal Axis Factoring 


Value Eigenvalue  % total var. Cumul. Eig.  Cumul. % 


IO TIN ER 10 CN RECO E 


Extraction Principal Axis Factoring 

NETA Factor 1 Factor 2 Factor 3 

0,10 
Control emocional | 020 | 090 | 025 | 


Actitud ante el trabajo 
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Tabla del ejercicio 3 (continuación). 


[Formación vocacional [ 035 | 070 [090 — 


4. En un estudio sobre una batería de pruebas psicológicas se obtuvo 
la siguiente solución de dos factores. Interprete los resultados. Aquí 
las variables ya están rotadas: 


Var. Factor 1 Factor 2 


0,297 
0,787 


0,046 


0,006 
0,037 


5. Se quiere hacer un estudio de las causas que intervienen en la 
promoción o no de los estudiantes y así obtener una forma para 
clasificarlos. Se seleccionaron las variables siguientes: 


X.: Edad. 


1 
: Indice académico. 


X 
2 
A Horas de estudio individual. 
X,: Motivación. 


X;,: Inteligencia. 
Se consideraron las poblaciones II,: promovidos (valor positivo) y 
ML: no promovidos (valor negativo), se aplicó un AD y se obtuvo la 
siguiente función D = -32X, + 2X, + 5X, + 3X, con una distancia de 


Mahalanobis de 7,5 y una tabla de clasificación como sigue: 


Bien clasificados Mal clasificados 


a) Analice la calidad de D y comente algo sobre la interpretación de 
la función. 
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b) Clasifique a Juan Pérez y a Marta Suárez, si se tiene lo siguiente: 


Juan Pérez 
Marta Suárez 


6. Se realizó un estudio sobre la apreciación de unas escenas fílmicas 
en 150 sujetos, 50 de los cuales eran paranoicos y se le asignó valor 
positivo. Se midieron las variables: 


X, 
X, 
X, 
X, 
X; 
Xo 
X, 


: Alusión sexual. 
: Trabalenguas. 
: Absurdos. 

: Amenaza. 

: Broma. 

: Sorpresa 

: Sutileza. 


La función que se obtuvo fue D = -0,312X, + 0,985X, +0,153X, y la 
distancia de Mahalanobis era 81,12. La tabla de clasificación fue la 
siguiente: 


e Bien clasificados Mal clasificados 
Grupo 1 
Grupo 2 


Analice cuáles variables aportan al análisis y cómo es la calidad de la 
función. 


7. En una investigación psicológica con fronterizos se analizaron las 
variables siguientes: 


,: Edad. 
,. Test colectivo. 


a Test de razonamiento mecánico. 


X 
X. 
X. 
X,: Test de velocidad y precisión. 
X;¿: Test de frases. 

X, 


s: Test de ortografía. 
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Se pretendía analizar, a través de esas variables, si se formaban gru- 
pos. Para ello se empleó el método del promedio con la distancia 
euclidiana que es: 
0,68 
1,65 1,80 
- 119 391 1,22 
1,58 1,72 1,01 1,21 
159 166 1,118 1,112 0,99 
170 184 123 113 1,113 0,73 
Dé sus conclusiones sobre este problema. 


8. Se realizó un estudio de cómo se agrupan ciertos idiomas, en de- 
pendencia de la forma de decir los números del 1 al 10. Se tomó un 
índice de similaridad y los idiomas analizados fueron: 

Inglés, Francés, Noruego, Español, Italiano. Holandés, Polaco, Ale- 
mán y Húngaro. A partir de la matriz de similaridad dada, construya 
el dendograma: 


10 


00 

py 

Oo 
pa Y 
o 


— 
o 


2 060_.ppapPpOO 
2>N0BpPEP —rQoa0 
NO 


N+4AO pgs 
Z 
EN O O IN ES 
20000 
2000 
Ez 
oO 


1 1 1. 0 10 


Interprete los resultados. 


9. Un psicólogo educacional desea analizar si se pueden clasificar, 
cuando comienzan en la escuela primaria, a los niños que provie- 
nen de círculo infantil (aunque hayan estado poco tiempo) y a los 
niños cuya formación es la dada solamente en su hogar. 
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10. 


11. 


Para este estudio se escogió una muestra de 15 niños procedentes 
de círculo infantil y otra muestra de 20 niños que no asisten al círcu- 
lo. Se midieron las variables siguientes: 


X,: Dominio del lenguaje. 

X,: Habilidad manual. 

X,: Grado de sociabilidad. 

X,: Grado de disciplina del escolar. 
X;: Talla. 


Se obtuvieron los siguientes resultados en la computado- 
ra; D = 0,43X, + 0,3X, — 0,5X, y se obtuvo además, que en esta 
función resultaron bien clasificados en el grupo de círculo 14 ni- 
ños, y en el que no asistieron resultaron bien clasificados 17. ¿Qué 
puede decir de los resultados? 


Se realizó un estudio con un grupo de alumnos de la universidad 
acerca de la motivación que ellos tienen hacia el deporte. El psicó- 
logo deseaba conocer si se podía discriminar en dos grupos de 
estudiantes: uno como estudiantes motivados hacia el gepone y el 
otro no motivados hacia el deporte. 


Se tomó una muestra de 10 estudiantes motivados hacia la actividad 
deportiva y 15 no motivados. Se midieron las variables siguientes: 


X.: Participación en actividades deportivas. 

X,: Participación en competencias y eventos. 

X,: Asistencia sistemática al deporte que practica. 
X,: Interés por combatir el sedentarismo. 


La función discriminante es D = 0,43X, - 0,73X, y tiene bien clasi- 
ficados en el grupo1, 9 estudiantes, y en el grupo 2, a 14. Además, 
la distancia de Mahalanobis fue de 23,4. 


a) Interprete los resultados. 

b) ¿Cómo clasificaría a los alumnos siguientes? 
Alumno 1 D = 3,2. 
Alumno 2 D = -1,7. 


Para realizar un análisis de los tipos de cuerpos se midieron en 240 
personas 9 variables. Se aplicó el AFC y arrojó los resultados 
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siguientes, de los cuales sólo se tienen los signos de saturaciones. 
Interprete los resultados: 

Variables Factor 1 

Altura de Pie + 


Altura sentado 
Longitud del brazo 
Longitud de la pierna 


Circunferencia del muslo 
Circunferencia del abdómen 


Circunferencia de la cadera 


Circunferencia del hombro 


. 
. z 
. 
. 

. 


UD 
Pl+ [+ [+ [+ [+ |+ + |+ 
ES 


% de var. explicada 


12. Repetir el Ejemplo 8.5.1 aplicando el método del vecino más cercano. 


13. En una investigación psicológica se analizaron las variables siguientes: 
X,: Edad. 
: Test colectivo. 


: Test razonamiento mecánico. 


X, 
X, 
X,: Test velocidad y precisión. 
X¿: Test de frases. 

X¿: Test de ortografía. 


El psicólogo quería realizar un análisis del comportamiento de es- 
tas variables en estudiantes de escolaridad universitaria. 


Se utilizó un programa de taxonomía numérica tomando en cuenta: 
a) Matriz de disimilaridad. 
b) Matriz de correlaciones (como similaridad). 


Analice los resultados y componentes todos a partir de construir el 
dendograma. : 


Datos: 
a) 3 se une a 4 al nivel -0,3948 
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5 se une a 6 al nivel 0,8557 


1 se une a3 al nivel 0,1593 

2 se une a 5 al nivel 0,2177 

1 se une a 2 al nivel -0,2123 

b) 3 se une a 4 al nivel 2,6957 
- Bseunea6alnivel 2,3923 
3 se une a 5 al nivel 15,1679 
1seunea3alnivel —  12,1404 

1 se une a 2 al nivel 41,5752 


. Dada una muestra de 187 alumnos de 15 años se quería determi- 
nar si los mismos no se comportaban según las normas estableci- 
das del desarrollo físico para dicha edad. 


Las variables medidas fueron: 

: Saltabilidad. 

X,: Velocidad. 

: Resistencia. 

X,: Agilidad. 

Las normas establecidas de cursos anteriores son para: 

XK 1,20 m. 

X,: 12,5 seg. 

X.: 1,50 min. 

X,. 13,8 seg. X, 
Supongamos que X=| y [distribuye normal. 

S j 
a) Escriba las hipótesis del problema. 
b) Si la salida dio que 7? = 1,3 y suponemos que 1 — a: = 0,95. ¿A 
qué conclusión se llega? 

. Un psicólogo educacional desea verificar la influencia de los cír- 
culos infantiles con respecto al desarrollo de los niños que no tie- 
nen ese tipo de actividad. Para este trabajo se tienen en cuenta las 
variables siguientes: 


X,: Habilidades numéricas. 
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X.: Tiempo en que demoran en identificar los colores. 
X,: Peso. 


El vector de variables X = (X,, X,, X,)' se supone distribuye normal 
multivariada (N(u, *)). En este trabajo se observaron 20 niños de 
círculo infantil y 17 niños que recibieron educación en su casa a 
través de su mamá en status de vida similar. 


a) Escriba las hipótesis del problema. 


b) Si se tiene que 7? = 0,82 y se supuso que 1 — a = 0,95, ¿a qué 
conclusión llega el psicólogo? 


16. Ante el mismo problema del ejercicio 8.15 el psicólogo decide ana- 
lizar las variables siguientes: 
X,: Habilidad manual. 
X,: Grado de sociabilidad. 
X,: Grado de disciplina. 


X,. Talla. 
En este caso se tuvo que 7* = 33,1. Analice el problema. 


17. Se analiza el comportamiento de las inversiones realizadas en el 
terreno. Las variables medidas fueron : 


X,: Construcción de hoteles. 
X.,: Flotas de transporte. 
X,: Instalaciones turísticas. 


Las salidas obtenidas fueron: 


1 


4,78 4,48 


a 


X x, 
2 


X, X Xx, 
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Varianza total = 0,024. 


Valores propios de la matriz de covarianzas 


o Valor propio Diferencia Proporción Acumulado 


MINOS 0.0233 0,0227 0,9605 0,09605 


INE 0.0006 0,0002 0,0247. | 0,9852 
NE 00004 | | 00148 1,0000 


Vectores propios 


PRINC 1 PRINC 2 PRINC 3 


0,6831 -0,1595 -0,7127 
0,5102 -0,5940 0,6219 
0,5225 0,7885 0,3244 


Analice las componentes principales. 


18. Determine los componentes principales de las variables con ma- 
triz de covarianza: 


15 6 
y = 
6 6 
Los valores propios asociados son: primer valor propio = 228, y 
segundo valor propio = 213. 
Y,: Crecimiento de la ingestación. - 
Y,: Madurez del fruto. 


Además, 


a) Calcule la proporción de la y varianza total explicada por el primer 
componente. 


b) Convierta * en una matriz de correlación. 


19. Sean las variables siguientes, Y: Coeficiente de adaptabilidad y 
Y,: Nivel de creatividad, las que fueron menda a 20 gerentes de 
nivel 1 en una empresa y se obtuvo: 


A 1134572 387,51 
a ET 387.51 7582 
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Determine los componentes principales muestrales y sus varianzas. 


Halle la proporción total de la varianza que explique el primer com- 
ponente. 


Halle la matriz de correlación y analícela. 


20. Se estudió el problema educacional, asociado a los objetivos de la 
asignatura de Estadística en varias especialidades. Se obtuvo la 
siguiente salida de forma típica. Interprete los resultados: 


Estimate factor 
Variables loading Communalities 
Fl F2 
0,0801 -0,542 0,933 0,071 
0,943  -0,110 
Pruebas de Hipótesis 0,562 0,813 0,973 


Specific 
Variances 


0,651 0,752 0,981 0,021 
0,782  -0,529 


Eigenvalues 2,849 1,808 


Cumulative Proportion | 0,571 0,932 
(Standardize Sample 
variance) 


Interprete los resultados. 


21. La maestría de los gerentes de una firma es valorada usando 5 
variables y asumiendo 2 factores. Se utiliza el método de máxima 
verosimilitud y se obtuvo: 


Máxima Componentes 
Verosimilitud Principales 
Factor Estimado Factor Estimado 


Varianza 
Específic- 


Variables Fo Fa  Varama FI F2 
: Específica Ñ 


Escolaridad 0,683 0,188 0,499 0,762 -0,217 0,399 
0,781 -0,442 0,178 0,711 0,525 0,219 
desición 


0,621 -0,0724 | 0,608 0.713 0,412 0,268 
Respesto alos | ¿¿93 0517 | 0248 | 0.773 -0,457 | 0,188 
subordinados 


358 


Ñ o M 


0,681 0,249 


0,484 0,598 


Analice y comente los resultados de la tabla. 


22. Un estudio de la valoración de 9 filmes entre una muestra de televi- 
dentes, permitió estimar los factores, y se obtuvo: 


Filme/Factor estimado MTS AOS M0 IO 
Ana y el Rey 


O, 
| La vida es bella | 050 |  -010 |  -006 | 
| Pocahontas [| 017 | 096 | 073 | 


Dice el productor de la cadena que lo más importante para los 
televidentes es la distinción por la fama internacional del filme. Que 
en segundo lugar está su facilidad de comprensión, ya que estas 
son vistas como un entretenimiento y no como un acto cultural. Por 
último, plantea que se exceptúan Pocahontas y Nikita, muy popu- 
lares y muy poco entretenidos; el tercer factor está asociado a dos 
elementos socioculturales de la zona de residencia. 


Diga si esos planteamientos son razonables. 
Grafique los dos primeros factores y haga las rotaciones necesa- 
rias de los ejes. 

23. En el ejemplo anterior se valora el nivel cultural de los que responden 
y el tiempo dedicado a ver televisión en dos barriadas. Si se tiene que: 


A nad 24,83 
edia 1 = -393 y Media 2 = 2.62 
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Al trabajar con variables centradas respecto a la media nacional, 
aceptamos la normalidad y obtenemos: 


e 131164 -899,42 
— (89942 108044 


Halle la regla discriminante. 


24. En la investigación del ejemplo anterior se obtuvieron los esta: 
dos siguientes: 


Clasificación 
Pertenencia Mr 7 
7 O O 
| Zoa2  [_ 2 | to | 


Halle el error de clasificación estimado. 


25. La matriz de distancia entre 5 escuelas secundarias fue obtenida 
utilizando los resultados de las calificaciones finales, esto es: 


0 
91 0 

D=| 32 17 0 
64 57 91 0 
113 106 214 83 0 


Halle cuál sería el primer conglomerado. 


26. De la tabla de datos del ejemplo 8.2, utilizando el sistema Statistica, 
-se obtuvo el gráfico siguiente de perfiles. Analice qué información 


se puede extraer: 
an cuadras.STA 5v * 8c 


e Ñ 
Case l Cás2 Case 3 
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Case 5 Case 6 Case 7 Case 8 
LEGEND (left to right): MAT, CNAT, FRAN, INGLES, SEXO 


27. La tabla siguiente es el resultado de una encuesta sobre el proce- 
so docente en la pregunta Dificultades por: a) Exceso de materias, 
b)Falta de base, c) Contenido complicado y difícil, y d) Exceso de 
pruebas. Esta encuesta fue realizada en una Facultad de la Uni- 
versidad de La Habana en la década del 80, y lo que se pretendía 
era, de forma gráfica, buscar ventajas y desventajas del plan de 
estudio A y del B. Emplee algún sistema estadístico para la cons- 
trucción del gráfico que usted decida, para realizar el análisis. 


Dificultad 
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TABLA 1. 
Probabilidad asociada a valorar extremos 
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et Eee 2 ela MEANS AAA SENASA AS 
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5] aos [eos [006] 097] 0 


de z en la distribución normal típica 


TABLA 2. 
Percentiles y probabilidades de la n (0, 1) 
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TABLA 2 


(continuación) 


TABLA 3. 
Valores críticos de t distribución t-Student 


Puntos percentiles 
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QS 
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NA 

: 
6 |0.5534 2.4469 3.7074 
ME 

| 9 | 

| 10 | 

TE 

ETE 

MO 


3.4995 
3.3554 


0.8755 2.2010 3.1058 
12 0.8726 2.1788 3.0545 
13 | 0.5375 | 0.8702 3.0123 


0.8681 2.6245 
0.8662 
16 [0.5350 | 0.8647 | 1.3368 | 1.7459 | 2.1199 
1.7396 
| 18 [0.5338 | 0.8620 
| 19 [0.5333 | 0.8610 | 1.3277 | 1.7291 
0.5329 
2.0739 
2.0687 
0.5312 1.3163 | 1.7081 
1.6973 
1.6839 
| 60 | 0.5272 | 0.8477 1.6706 
| so [0.5265 | 0.8461 | 1.2922 | 1.6641 | 1.9901 | 2.3739 
| 100 | 0.5261 | 0.8452 | 1.2901 | 1.6602 | 1.9840 | 2.3642 | 2.6259 | 
1.6525 | 1.9719 
300 1.6499 | 1.9679 
0.5244 | 0.8417 | 1.2816 | 1.6450 | 1.9602 2.5763 


TABLA 4. 


Valores críticos de la distribución chi cuadrado 
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Valores de la distribución F(M, N) nivel de significación 5 % [F ,¿(M, N)] 
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TABLA 5b. 
Valores de la distribución F(M, N) nivel de significación 1% [F ¿¿(M, N)] 
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TABLA 5b. 
(continuación) 
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TABLA 5c 


Valores de la distribución F(M, N) nivel de significación 10 % [F,¿(M, N)] 
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TABLA 5c 
(continuación) 
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asasasaiasias esa QS ASES RAZAS 
N “MM AaAAAAA AAA AOSAjOSA AQ A] A] AAA] aAjAajaAj]a| aja 
Oi SO] Oj] NO] Oj “(Y O] | O] mio Si o SO |mi FT [|mia Av 

FEAR E ASREARERABRBEREeESESPSA SECA 
2 ni aaa a A AA A a | a AA aj AAA AA] A AA AAA Aja 
NES JR] oOi|alemioo] + | So!|R|uniaA e vil <Fl el (los Qi mn] 
JRRREREADRSEA ERE ESE EEE EEES 
a E UB Aaa a aj a] A aja] aa] aa ANA A ANA AAA] aja 
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vze 


para n = 


_0.95099 O. 0.77378 0.59049 0.44371 0.32768 0.23730 -0.16807. 16807 0.13169 0.11603 0.07776 0. 0.0503. 0.03450 0.03125 


TABLA 6. 
Probabilidades de la binominal 


P(X =k)= Y AU aja 


1,2,3,...,10 y p=0.01, 0.05, 0.1, 0.15, 0.2, 0.25, 0.3, 0,33, 0.35, 0.4, 0.45, 0.49, 0.5 


0. 98010 0.90250: 0.81000 0.72250 0.64000 0.56250 0.49000 0.44444 0.42250 0, 36000 0.30250 0.26010 0.25000 


A A o A A A A A A PE AA Y A A A A e A O e e rn e 


0.01980 0.09500 0.18000 0.2500 0.32000 0.37500 0.42000 0.44444 0.45500 0.48000 0.49500 0.49980 0.50000 


lo. 00030. 0. 0.00713 0. 02700 0. (05738 o. 09600. o. 14063 o. 18900 0. 22222. 0, 23888 0. 28800 O. 33413 o. 36735 0. -37500| 


0.00000 0.00013 0.00100 0.00338 0.00800 0.01563 0.02700 0.03704 0.04288 0.06400 0.09113 0.11765 0.12500 


O. (03881 7. 17148 0. 0.29160 o. 36848 0. 40960 0. 42188 0, 0.4160 0. 39506. 0. 38448 o. 34560 0. 29948 0, 26000. % 25000 


(0.0 00059 0.01354 0.04860 0.09754 0.15360 0.21094 0.26460 0.29630 0.31054 0.34560 0.36754 0.37470 0.37500 


10.00000 0.00048 0.00360 0.01148 0.02560 0.04688 0.07560 0.09877 0.111483 0.15360 0.20048 0.24000 0.25000 


0.00000 0.00001 0.00010 0.00051 0.00160 0.00391 0.00810 0.01235 001501 0.02560 0.04101 0.05765 0.06250 


0.04803 0.20363 0.32805 0.39150 0.40960 0.39551 0.36015 0.32922 0.31239 0.25920 0.20589 0.16575 0.15625 
0.00097 0.02143 0.07290 0.13818 0.20480 0.26367 0.30870 0.32922 0.33642 0.34560 0.33691 0.31850 0.31250 


0.00001 0.00113 0.00810 0.02438 0.05120 0.08789 0.13230 0.16461 0.18115 0.23040 0.27565 0.30601 0.31250 


[0:00000 0.0000 0.0001 0.00008 0.0032 0.00098 0.00243 0.0412 0.00525 0.01024 0.01845 0.02825 0.3125 
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TABLA 6. 
(continuación) 


A O A A A 


A A A a A A A a A e A 


0.00000 0.00008 0.00122 0.00549 0.01536 0.03296 0.05954 0.08230 0.09510 0.13824 0.18607 0.22491 0.23438 


0.00000 0.00000 0.00005 0.00039 0.00154 0.00439 0.01021 0.01646 0.02048 0.03686 0.06089 0.08644 0.09375 


0.00000 0.00000 0.00000 0.00001 0.00006 0.00024 0.00073 0.00137 0.00184 0.00410 0.00830 0.01384 0.01563 
0.93207 0.69834 0.47830 0.32058 0.20972 0.13348 0.08235 0.05853 0.04902 0.02799 0.01522 0.00897 0.00781 


A A A A A A A A PX A A A A A A A A A XA XXX A PP A A A A AP AX O A PA PP 


A A AA O A AP A A A A A A A PP A A ms 
ed A MAA A A NAAA AAN A AN A AA A o AA 


daa ti dd AER AAA de Am dd ind de A did dt diet A a 


_10.00000 0.00019 0.00255 0.01088 0.02867 0.05768 0.09724 0.12803 0.14424 0.19354 0.23878 0.26765 o. 27344 


A ANDAS A A A A A A 


0.00000 0.00001 0.00017 0.00115 0.00430 0.01154 0.02500 0.03841 0.04660 0.07741 0.11722 0.15429 0.16406 


A A A A A A A A A A A e A A ss 


0.00000 0.00000 0.00001 0.00007 0.00036 0.00128 0.00357 0.00640 0.00836 0.01720 0.03197 0.04941 0.05469 


0.00000_0.00000 0.00000 0.00000 0.00001 0.00006 0.00022 0.00046 0.00064 0.00164 0.00374 0.00678 0.00781 
0.92274 0.66342 0.43047 0.27249 0.16777 0.10011 0.05765 0.03902 0.03186 0.01680 0.00837 0.00458 0.00391 


0.07457 0.27933 0.38264 0.38469 0.33554 0.26697 0.19765 0.15607 0,13726 0.08958 0.05481 0.03518 0.03125 


_10.00264 0.05146 0.14880 0.23760 0.29360 0.31146 0.29648 0.27313 0.25869 0.20902 0.15695 0.11830 0. 10938 


0.00005 0.00542 0.03307 0.08386 0.14680 0.20764 0.25412 0.27313 0.27859 0.27869 0.25683 0.22731 0 21875 


0.00000 0.00036 0.00459 0.01850 0.04588 0.08652 0.13614 0.17071 0.18751 0.23224 0.26266 0.27300 0.27344 


0.00000 0.00002 0.00041 0.00261 0.00918 0.02307 0.04668 0.06828 0.03077 0.12386 0.17192 0.20984 0.21875 


/0.00000 0.00000 0.00002 0.00023 0.00115 0.00385 0.01000 0.01707 0.02175 0.04129 0.07033 0.10080 0.10938 


0.00000 0.00000 0.00000 0.00001 0.00008 0.00037 0.00122 0.00244 0.00335 0.00786 0.01644 0.02767 0.03125 


0.00000_0.00000 0.00000 0.00000 0.00000 0.00002 0.00007 0.00015 0.00023 0.00066 0.00168 0.00332 0. 00391 
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TABLA 6. 
(continuación) 


0.00000 0.00 0.0061. 0.0744 0.02830 0.06606 0.1 o. 11680 o. 17153. 0.20485 021939 0.25082 0.26004 0.25061 0.24609 


0.00000_ 0, 0.0003. 0.0083 _0.00499 0.01652 0.03893 0.07351 0.10242 0.11313 0.16722 0.21276 0.24079 0.24609 


Lo 0.09135 0 031512. o. 38742. o. 34743 0.26844 o. 18771 o. 12106 0.08671 0.07249 0.04031 0.02072 0.01144 | 0.00977 


0.00000 0.00000 0.00000 0.00001 0.00007 0.00039 0.00145 0.00305 0.00423 0.01062 0.02289 0.03890 0.04395 
0.00000 0.00000 0.00000 0.00000 0.00000 0.00003 0.00014 0.00034 0.00051 0.00157 0.00416 0.00830 0.00977 
0.00000 0.00000 0.00000 0.00000 0:00000 0.00000 0.00001 0.00002 0.00003 0.00010 0.00034 0.00080 0.00098 


TABLA 7. 


Función de probabilidad de la distribución de Poisson 


xl 


ke* 


x)= 


para k = 0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 


PX 


5] 
o 
5] 
o 
E 
20 
1) 
on 
20 
om 
Ne 
o. 
Sa 


0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 


_o |o.9004983|o.98019867|0.97044553 
_1 jo.009900so|0.01960397/0.02911337|0.03843158 


| 2 |0.00004950 0.00019604/0.00043670/0.00076863|0.00118904/0.00169518|0.00228436|0.00295397/0.00370142 


377 


0.00003390|0.00005330|0.00007877/0.00011104 


0.00000437/0.00001025/0.00001982 


/0.00000000|0.00000001 0.00000093|0.00000158|0.00000250 


0.00000017 


gls 


TABLA 7. 
(continuación) 


MENESES 


0 |0.90483742 0.81873075 0.74081822 0.67032005 0.60653066]0.54881164/0.49658530]0.44932896]0.40656966 
L1|0.09048374|0.16374615|0.22224547|0.26812802|0.30326533| 0.32928698 0.34760971]0.359463170.36591269] 
2 |0.00452419|0.01637462 0.03333682 0.05362560|0.07581633|0.09878609|0.12166340]0.14378527/0.16466071 
3 0.00015081]0.00109164|0.00333368 0.00715008 0.01263606]0.01975722]0.02838813|0.03834274]0.04939821 
4 0.00000377|0.00005458] 0.00025003| 0.00071501|0.00157951|0.00296358|0.00496792]0.00766855]0.01111460 
_5|0.00000008]0.00000218 0.00001 500] 0.00005720)0.00015795|0.000355630.000695510.00122697|0.00200063| 
0.00016360|0.00030009) 
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TABLA 7. 
(continuación) 


NAAA E A 
0 |0.36787944[0.13533523]0.04978707|0.01831564|0.00673795|0.00247875|0.00091188|0.00033546|0.00012341 
_1/0.36787944/0.27067057|0.14936121|0.07326256/0.03368973|0.01487251|0.00638317/0.00268370|0.00111069] 
2 Jo103997jo 27051 2400100146551 0642434] 0601754 0225411/00107348 00049810 
L3|0.06131324/0.18044704]0.22404181]0.19536681|0.14037390]0.08923508|0.05212925]0.02862614|0.01499429 
4 |0.01532831[0.09022352|0.16803136]0.19536681]0.17546737]0.13385262/0.09122619]0.05725229]0.03373716 
L5 |0.00306566|0.03608941]0.10081881]0.15629345|0.17546737]0.16062314/0.12771667|0.09160366|0.06072688 
L6 |0.000510940.01202980/0.05040941|0.10419563|0.14622281|0.16062314|0.14900278|0.12213822]0.09109032] 
200000010. 001909 [09027005 0.0132311/0.9362655 006883849/0.10149497 0 12407092 .13175564 


TABLA 7. 
(continuación) 
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TABLA 8. 
Tabla de valores críticos de D en la prueba de una muestra 


de Kolmogorov-Smirnov 


2 
18 | 24 | 259 | .278 | .309 | .371 

2 19 | 237 | 252 | .272 | .301 | .363 
a as | 246 | 264 | 294 | 356] 
2 2282 [92111 2 | 24 | .27 | .32 | 
NOE ACV E A 
IS 48 019 1 2 1 9971 272 
1.14/VN|1.22 / YN 1.63 / 


TABLA 9. 


Tabla de valores críticos de K, en la prueba de dos muestras 


de Kolmogorov -— Smimov 


(muestras pequeñas) 


Prueba de dos colas 


Prueba de una cola 


al 
. 


11 


¡00 Le] 


TABLA 10. 
Tabla de valores críticos de D en la prueba de dos muestras 
de Kolmogorov — Smirnov 


Valores de D tan grandes que requieren 
rechazar Hp en el nivel de significación indicado 
donde D = máximo | Sus(x) - Sie) | 


(muestras grandes: prueba de dos colas) 
Nivel de significación 


HE: Pe 


Mn, +A, 
nn, 


Donde m= 


TABLA 11. 
Tabla de valores críticos de r en la prueba de rachas. 

Se dan en los cuerpos de las tablas 11a y 11b diferentes valores críticos 
de r para distintos valores de n, y n,. Para la prueba de las rachas de una 

muestra, cualquier valor de r es igual o menor que el que aparece en la 

Tabla 11a, o igual o mayor que el que aparece en la tabla 11b, es significativo 
en el nivel 0.05. Para la prueba de las rachas de dos muestras de Wald- 
Wolfowitz, cualquier valor de la tabla 11a es significativo al nivel 0.05. 


TABLA 11a. 


bh Yuu tw ly w y Y nn DN NN 
úl ph00Y6u yu nn vn 

DD O in Un Un Uu tn Un fa e da fs UY UY 4 un mn 
DODADDAQ4n ua a de E UY UY ww nn 
A Y] Y] ADOOS AAO Mas Un A fa Y wi wn 
00 00 0 JA ZJDOOOsUsUn Un das e UY Win 
NO 0% 00 0 0 A ALLIADAA Ms a UY 
O 000000 IZDAAs asa 
DIVA AAA ASIN 


Z 
pa 
2 
2 
Z 
2 
2 
2 
2 
3 
3 
3 
3 
3 
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TABLA 12. 
Tabla de prueba de los rangos señalados 1 muestra (Wilcoxon) 


Nivel de significación par: prueba de una cola 


TABLA 13. 
Tabla de prueba de los rangos señalados 1 muestra (2 muestras) 
Probabilidades asociadas con valores tan pequeños como los valores de U 
en la prueba de Mann-Whitney 


TABLA 13. 
(continuación) 
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TABLA 13. 
(continuación) 


n,=6 


TABLA 13. 
(continuación) 


TABLA 14a. 
Tabla de prueba de los rangos señalados 1 muestra (2 muestras) 
Valores críticos de U en la prueba de Mann-Whitney 
Para una prueba de una cola con a = 0.001 
Para una prueba de dos colas con a = 0.002 


TABLA 14b. 
Tabla de prueba de los rangos señalados 1 muestra (2 muestras) 
Valores críticos de U en la prueba de Mann-Whitney 
Para una prueba de una cola con a = 0.01 
Para una prueba de dos colas con a. = 0.02 
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TABLA 14c. 
Tabla de prueba de los rangos señalados 1 muestra (2 muestras) 
Valores críticos de U en la prueba de Mann-Whitney 
Para una prueba de una cala con a = 0.025 
Para una prueba de dos colas con a = 0.05 


TABLA 14d. 
Tabla de prueba de los rangos señalados 1 muestra (2 muestras) 
Valores críticos de U en la prueba de Mann-Whitney 
Para una prueba de una cola con a = 0.05 
Para una prueba de dos colas con a = 0.10 


15 
18 
21 


Y UY uy YN yN 
NO 


hb 


nn un 
Rh 


TABLA 15a. 
Tabla de probabilidades asociadas con valores tan grandes como tos 
valores de observados de y? en el análisis de varianza 
de dos clasificaciones por rangos de Friedman 


TABLA 15a. 
(continuación) . 


TABLA 15b. 
Tabla de probabilidades asociadas con valores tan grandes como los 
valores de observados de y? en el análisis de varianza 
de dos clasificaciones por rangos de Friedman 


TABLA 16a. 
Tabla de probabilidades asociadas con valores tan grandes como 
los valores de observados de H en el análisis de varianza 
de una clasificación por rangos de Kruskal-Wallis 


.100 
.129 


3.5714 


4.8214 E 
.076 
.114 


TABLA 16b. 
Tabla de probabilidades asociadas con valores tan grandes como 
los valores de observados de H en el análisis de varianza 
de una clasificación por rangos de Kruskal-Wallis 


TABLA 17. 
Tabla valores críticos de r,, el coeficiente de correlación 


de rangos de Spearman 


TABLA 18. 
Tabla de probabilidades asociadas con valores tan grandes 
como los valores de observados de $ en el coeficiente 
de correlación de rango de Kendall 


Valores de N 


si, ValoresdeN____|6 
TA 


TABLA 19. 
Tabla de valores críticos de S en el coeficiente de concordancia de Kendall 


Valores 
adicionales 
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TABLA 20. 


N M 
Tabla de coeficientes binominales = 
k j] KUN — ko)! 


NOA O O O O AECE 
PEREREREEEErrrrrrrrErEEADD 
arca asa 


dl 9 el1015 21128 38 as 68 68, 78, 01 108, 120 138 168 171 180] 2t0 201 268 


020 36| e] ed/120/1651220| 268, 364 455, 560 660, e1el 969 1140 so 
Aaa aaa 
El a 
1, 7128 edlz1oJsezie24 171630035008, e008|12978|18504'27132| 38780) 54204| 746131 100947 
al 36120] 7921716 6435 0119448] 50388] 7752011162801170544 245157 
|_1,_ dl as1esla9s!1287 9009/6435 128702431049758/75582/125970203490|319770| 490914 
e ro ao ere pronta ss 
o e ore 


436812376 75582/167960/352716/705432/1352078 


lalo oblea 


> 


TABLA 20. 
(continuación) 


ohon11ezoaeren seat 01780 


dm rro stos st 


17, 159 esa asas! z0349| 746131 2e5157| 


1 18l 171| 1140 la 


19 13301 7315 33649] 
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